Каталог моделей
🧠 Мультимодальная💬 Текст🎨 Изображения💻 Код🎬 Видео API

Gemini 2.5 Pro

GoogleДата выхода: 25 мар 2025Контекст: 1M токенов Сайт

Gemini 2.5 Pro — самая мощная модель Google с расширенным мышлением (thinking). Контекст 1M токенов, лидер в кодинге и рассуждениях. Выпущена в марте 2025 года.

Тарифы

Google AI Studio Free
Бесплатно
  • 5 RPM, 25 запросов в день (с thinking)
  • Ограниченный доступ к thinking режиму
  • Без платёжной карты
API — ввод (до 200K)
$1.251M токенов
  • Полный API доступ
  • Thinking mode
  • Нативная мультимодальность
API — вывод
$10.001M токенов
  • Streaming
  • Thinking tokens включены
  • Нет доп. платы за thinking
API — ввод (200K+)
$2.501M токенов
  • Длинный контекст
  • Анализ больших видео
  • Batch processing

Плюсы и минусы

Плюсы

  • Лидер LMSYS Chatbot Arena — высший Elo-рейтинг среди всех моделей на март 2025
  • Режим расширенного мышления (thinking) для сложных задач
  • Контекст 1M токенов с поддержкой видео и аудио
  • Отличные результаты на LiveCodeBench и SWE-bench
  • Нативная обработка видео до 1 часа в одном запросе

Минусы

  • Высокая стоимость: $1,25–$2,50 за ввод, $10 за вывод
  • Thinking режим замедляет ответ — не подходит для real-time
  • Иногда overthinking: слишком сложные ответы на простые вопросы
  • Пока нет поддержки в некоторых корпоративных регионах Vertex AI

Подробный обзор

Gemini 2.5 Pro — флагманская модель Google DeepMind, представленная 25 марта 2025 года. Ключевое нововведение по сравнению с Gemini 1.5 Pro и 2.0 — встроенный режим расширенного мышления (thinking): перед ответом модель выполняет внутреннюю цепочку рассуждений, что резко повышает качество на сложных математических, логических и программных задачах.

На момент выхода Gemini 2.5 Pro занял первое место в LMSYS Chatbot Arena — наиболее авторитетном человеческом рейтинге качества LLM. На бенчмарке LiveCodeBench (решение задач программирования) модель набрала 70,4%, обогнав Claude Sonnet 3.7 и GPT-4o. На AIME 2025 (олимпиадная математика) — 86,7%.

Режим мышления и мультимодальность

Thinking mode в Gemini 2.5 Pro работает иначе, чем в o1/o3 OpenAI: мысли модели частично видны разработчику через streaming API, что помогает в отладке агентных систем. Бюджет мышления настраивается параметром thinkingBudget — от 0 (отключено) до 32 768 токенов. Важно: стоимость thinking tokens включена в стандартные $10/1M выходных токенов, без дополнительной наценки.

Мультимодальные возможности включают обработку видеофайлов длиной до 1 часа в одном запросе, аудио, изображений и PDF. Контекст в 1M токенов позволяет загрузить, например, 10 часов транскрипций или полный исходный код крупного проекта. Нативная интеграция с Google Search обеспечивает доступ к актуальным данным.

Доступность и цены

API доступен через Google AI Studio и Vertex AI. Стоимость $1,25 за 1M входных токенов (до 200K) и $10 за 1M выходных — дешевле Claude Sonnet 3.7 Thinking и сопоставимо с GPT-4o при значительно большем контексте. Бесплатный уровень в AI Studio ограничен 25 запросами в день с thinking, что достаточно для тестирования и прототипирования.

Вопросы и ответы

Что такое thinking mode в Gemini 2.5 Pro?+
Это режим расширенного мышления: перед ответом модель выполняет внутреннюю цепочку рассуждений (chain-of-thought), что значительно улучшает качество на математике, логике и сложном коде. Thinking tokens видны в streaming API. Бюджет мышления настраивается параметром thinkingBudget.
Чем Gemini 2.5 Pro отличается от Gemini 2.5 Flash?+
Gemini 2.5 Pro — более мощная и дорогая модель для сложных задач. Flash — быстрее и дешевле, оптимизирована для высоконагруженных приложений. Pro значительно лучше на бенчмарках рассуждений и кода, Flash предпочтительнее для простых задач с высоким трафиком.
Как получить доступ к Gemini 2.5 Pro бесплатно?+
Через Google AI Studio (aistudio.google.com) — 5 RPM и 25 запросов в день, включая thinking mode. Этого достаточно для тестирования. Также модель доступна в Gemini Advanced (Google One AI Premium, $19,99/мес) через веб-интерфейс gemini.google.com.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно

Используете Gemini 2.5 Pro?

Поделитесь опытом в нашем сообществе

Написать пост