🧠 Мультимодальная💬 Текст🎨 Изображения💻 Код API

Gemini 2.0 Flash

GoogleДата выхода: 11 дек 2024Контекст: 1M токенов Сайт

Gemini 2.0 Flash — быстрая и дешёвая мультимодальная модель Google с контекстом 1M токенов. Поддерживает текст, изображения, аудио и видео. Есть бесплатный уровень через Google AI Studio.

—

Тарифы

Google AI Studio Free

Бесплатно

15 RPM, 1500 запросов в день
Лимит: 1M токенов в минуту
Без платёжной карты

API — ввод (до 128K)

$0.101M токенов

Полный API через Google AI / Vertex
Мультимодальные запросы
Function calling

API — вывод

$0.401M токенов

Streaming
Grounding с Google Search
Нативная генерация изображений

API — ввод (128K+)

$0.401M токенов

Длинный контекст > 128K токенов

Плюсы и минусы

Плюсы

Рекордный контекст 1 миллион токенов — крупнейший среди коммерческих моделей
Сверхнизкая цена: $0,10/$0,40 за 1M токенов
Бесплатный уровень через Google AI Studio без карты
Поддержка нативной мультимодальности: текст, фото, аудио, видео
Интеграция с Google Search (Grounding) для актуальных данных

Минусы

Иногда уступает GPT-4o и Sonnet 3.5 в сложных рассуждениях
Нестабильность в следовании инструкциям на сложных задачах
Grounding с поиском доступен не во всех регионах
Качество на русском языке несколько ниже, чем у топовых конкурентов

Подробный обзор

Вопросы и ответы

Чем Gemini 2.0 Flash отличается от Gemini 1.5 Flash?+

Gemini 2.0 Flash превосходит 1.5 Flash по качеству рассуждений и кода, добавляет нативную генерацию изображений, улучшает поддержку инструментов и мультиагентных сценариев. Цена немного выросла ($0,10 vs $0,075 за ввод), но возможности значительно расширились.

Как бесплатно использовать Gemini 2.0 Flash?+

Через Google AI Studio (aistudio.google.com) — бесплатно без карты. Лимиты: 15 запросов/минуту, 1500 запросов/день. Также доступна в Gemini.google.com для конечных пользователей. API без оплаты ограничен только RPM и дневными квотами.

Поддерживает ли Gemini 2.0 Flash реальные данные из интернета?+

Да, через функцию Grounding с Google Search модель может получать актуальные данные при ответе на вопросы. Функция платная ($35 за 1000 запросов с Grounding) и доступна в API. Без Grounding знания ограничены датой обучения.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Изображения

ChatGPT Images 2.0

OpenAI

Флагманская модель OpenAI для генерации изображений внутри ChatGPT. Умеет искать в интернете перед созданием картинки, генерировать несколько вариантов из одного промпта и проверять результат. Разрешение до 2K, корректный рендеринг текста внутри изображений, поддержка нескольких соотношений сторон. Подходит для маркетинговых материалов, журнальных макетов и многопанельных комиксов

$20/мес

Используете Gemini 2.0 Flash?

Поделитесь опытом в нашем сообществе

Написать пост