GPT-4o Mini — лёгкая и сверхдешёвая версия GPT-4o от OpenAI. При стоимости $0,15 за 1M входных токенов обеспечивает качество уровня GPT-4 для большинства практических задач.
—
Тарифы
Бесплатно
Бесплатно
Доступ через ChatGPT Free
Основная модель для бесплатных пользователей
Без ограничений по сообщениям
API — ввод
$0.151M токенов
Самый дешёвый GPT-4 класс
Поддержка vision
Function calling и JSON-режим
API — вывод
$0.601M токенов
Streaming ответы
Высокая скорость
Кэширование промптов
Плюсы и минусы
Плюсы
Сверхнизкая цена: в 17 раз дешевле GPT-4o
Высокая скорость ответа, подходит для real-time приложений
Качество превосходит GPT-3.5 Turbo при меньшей стоимости
Поддержка vision — анализ изображений
Большой контекст 128K токенов
Минусы
Заметно уступает GPT-4o в сложных рассуждениях и STEM задачах
Слабее в генерации длинных структурированных текстов
Не поддерживает аудио напрямую
Иногда ошибается в сложных многошаговых задачах
Подробный обзор
Вопросы и ответы
Чем GPT-4o Mini отличается от GPT-4o?+
GPT-4o Mini — облегчённая версия с меньшими параметрами. Она работает быстрее и стоит в 17 раз дешевле ($0,15 vs $2,50 за 1M входных токенов), но уступает GPT-4o в сложных рассуждениях, математике и программировании. Для простых задач разница незаметна.
Заменяет ли GPT-4o Mini GPT-3.5 Turbo?+
Да, OpenAI официально позиционирует GPT-4o Mini как замену GPT-3.5 Turbo. Новая модель дешевле, быстрее и значительно превосходит GPT-3.5 по качеству — особенно в понимании контекста, следовании инструкциям и работе с кодом.
Поддерживает ли GPT-4o Mini работу с изображениями?+
Да, GPT-4o Mini поддерживает vision — анализ и описание изображений, ответы на вопросы по фото, распознавание текста на снимках. Это выгодно отличает её от GPT-3.5 Turbo, который работал только с текстом.
GPT-4o Mini — компактная и экономичная версия GPT-4o, выпущенная OpenAI 18 июля 2024 года как замена GPT-3.5 Turbo. Несмотря на меньший размер, модель демонстрирует качество, значительно превосходящее GPT-3.5, при стоимости в $0,15 за миллион входных и $0,60 за миллион выходных токенов — это делает её одним из самых выгодных вариантов на рынке.
В бенчмарке MMLUGPT-4o Mini набирает 82%, что выше, чем GPT-4 (оригинальный, 2023 года) в ряде подкатегорий. В HumanEval для Python-кода — 87,2%. Модель отлично справляется с классификацией, резюмированием, ответами на вопросы, базовым кодингом и переводом текстов, где разница с GPT-4o минимальна.
Для каких задач подходит
GPT-4o Mini идеально подходит для high-volume приложений с умеренными требованиями к качеству: чат-боты поддержки, классификация текстов, автозаполнение, парсинг данных, базовый код-ревью, перевод документов. При обработке миллионов токенов в день разница в стоимости между GPT-4o и GPT-4o Mini составляет тысячи долларов в месяц.
Модель также поддерживает vision — анализ изображений, что делает её универсальным решением для мультимодальных приложений с бюджетными ограничениями. В ChatGPT Free GPT-4o Mini является основной моделью, на которую система переключается при превышении лимита GPT-4o. Через API модель доступна всем пользователям без специальных квот.
Сравнение с конкурентами
В ценовом сегменте до $1 за 1M токенов GPT-4o Mini конкурирует с Gemini 2.0 Flash ($0,10/$0,40) и Claude Haiku ($0,25/$1,25). Gemini Flash немного дешевле и имеет контекст 1M токенов, но GPT-4o Mini часто предпочитают за более предсказуемое поведение и широкую экосистему инструментов OpenAI.