Gemini 2.5 Pro
Gemini 2.5 Pro — самая мощная модель Google с расширенным мышлением (thinking). Контекст 1M токенов, лидер в кодинге и рассуждениях. Выпущена в марте 2025 года.
Тарифы
- 5 RPM, 25 запросов в день (с thinking)
- Ограниченный доступ к thinking режиму
- Без платёжной карты
- Полный API доступ
- Thinking mode
- Нативная мультимодальность
- Streaming
- Thinking tokens включены
- Нет доп. платы за thinking
- Длинный контекст
- Анализ больших видео
- Batch processing
Плюсы и минусы
Плюсы
- Лидер LMSYS Chatbot Arena — высший Elo-рейтинг среди всех моделей на март 2025
- Режим расширенного мышления (thinking) для сложных задач
- Контекст 1M токенов с поддержкой видео и аудио
- Отличные результаты на LiveCodeBench и SWE-bench
- Нативная обработка видео до 1 часа в одном запросе
Минусы
- Высокая стоимость: $1,25–$2,50 за ввод, $10 за вывод
- Thinking режим замедляет ответ — не подходит для real-time
- Иногда overthinking: слишком сложные ответы на простые вопросы
- Пока нет поддержки в некоторых корпоративных регионах Vertex AI
Подробный обзор
Gemini 2.5 Pro — флагманская модель Google DeepMind, представленная 25 марта 2025 года. Ключевое нововведение по сравнению с Gemini 1.5 Pro и 2.0 — встроенный режим расширенного мышления (thinking): перед ответом модель выполняет внутреннюю цепочку рассуждений, что резко повышает качество на сложных математических, логических и программных задачах.
На момент выхода Gemini 2.5 Pro занял первое место в LMSYS Chatbot Arena — наиболее авторитетном человеческом рейтинге качества LLM. На бенчмарке LiveCodeBench (решение задач программирования) модель набрала 70,4%, обогнав Claude Sonnet 3.7 и GPT-4o. На AIME 2025 (олимпиадная математика) — 86,7%.
Режим мышления и мультимодальность
Thinking mode в Gemini 2.5 Pro работает иначе, чем в o1/o3 OpenAI: мысли модели частично видны разработчику через streaming API, что помогает в отладке агентных систем. Бюджет мышления настраивается параметром thinkingBudget — от 0 (отключено) до 32 768 токенов. Важно: стоимость thinking tokens включена в стандартные $10/1M выходных токенов, без дополнительной наценки.
Мультимодальные возможности включают обработку видеофайлов длиной до 1 часа в одном запросе, аудио, изображений и PDF. Контекст в 1M токенов позволяет загрузить, например, 10 часов транскрипций или полный исходный код крупного проекта. Нативная интеграция с Google Search обеспечивает доступ к актуальным данным.
Доступность и цены
API доступен через Google AI Studio и Vertex AI. Стоимость $1,25 за 1M входных токенов (до 200K) и $10 за 1M выходных — дешевле Claude Sonnet 3.7 Thinking и сопоставимо с GPT-4o при значительно большем контексте. Бесплатный уровень в AI Studio ограничен 25 запросами в день с thinking, что достаточно для тестирования и прототипирования.