Gemini 3.1 Pro vs MAI-Transcribe-1 — сравнение бенчмарков
MAI-Transcribe-1 специализируется на транскрипции и превосходит Gemini 3.1 Pro в точности распознавания речи. Gemini лидирует как универсальная языковая модель.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
MAI-Transcribe-1 Microsoft и функция транскрипции Gemini 3.1 Pro конкурируют в сценариях обработки аудиоконтента. WER MAI-Transcribe-1 составляет 3% против 6% у Gemini 3.1 Pro в транскрипции.
Для production-транскрипции MAI-Transcribe-1 предпочтительнее. Gemini 3.1 Pro выигрывает, когда нужна полная обработка: транскрипция плюс суммаризация, извлечение действий и перевод — всё в одном запросе.
Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.
Тарифы, обзор, бенчмарки →Модель распознавания речи Microsoft. 25 языков включая русский. В 2.5 раза быстрее Azure Fast. Лучший WER на FLEURS, обгоняя Whisper, GPT-Transcribe и Gemini Flash-Lite. Аудиофайлы до 200 МБ.
Тарифы, обзор, бенчмарки →