Штруцель
Сообщество
Статьи
Новости
Свежие релизы и обновления
Статьи
Аналитика и разборы
Гайды
Пошаговые инструкции
Обзоры
Сравнения и тесты
Туториалы
Практические уроки
Модели
Текстовые
GPT, Claude, Gemini и другие
Изображения
Midjourney, DALL-E, FLUX
Код
Copilot, Cursor, Windsurf
Видео
Sora, Runway, Kling
Музыка
Suno, Udio
Инструменты
Генератор промптов
Для ChatGPT, Claude, Midjourney
Переводчик ошибок
Объяснение на русском
Рерайтер текста
Перефразирование с ИИ
GPT-чат
Бесплатно, без VPN
Промпт-Баттл
Два ИИ спорят
SEO-аудит
Проверка сайта
Хабы
Claude Code
IDE-агент Anthropic
ChatGPT
OpenAI GPT-5
Midjourney
Генерация картинок
Cursor
AI-IDE
Gemini
Google AI
Все хабы
16 брендов ИИ
Рейтинги
Бесплатные
ИИ с бесплатным доступом
Бюджетные
Самые дешёвые по $/1M
Работают в РФ
Без VPN и иностранной карты
Для кода
По SWE-Bench и HumanEval
Для картинок
Midjourney, FLUX, DALL-E
Для видео
Sora, Veo, Kling, Runway
Для музыки
Suno, Udio, MusicGen
Для голоса
ElevenLabs, Whisper
Все рейтинги
15 подборок по задачам
Аналитика
Сравнение моделей
Бенчмарки, цены, вердикт
Хронология моделей
Таймлайн и граф релизов
Shtruzel
Сообщество
Новости
Статьи
Модели
Инструменты
Рейтинги
Аналитика
Сервисы
Хабы16
Claude CodeChatGPTCursorMidjourneyElevenLabsGeminiGitHub CopilotWindsurfPerplexityGrokYandexGPTGigaChatStable DiffusionFLUXDeepSeekKling
Тёмная тема
ShtruzelShtruzel

Каталог, рейтинги и обзоры нейросетей. Бенчмарки, цены, возможности 70+ AI-моделей.

info@shtruzel.ruTelegram-канал

Каталог

  • Для текста
  • Для картинок
  • Для видео
  • Для музыки
  • Для голоса
  • Для кода
  • Все модели
  • Хабы брендов

Рейтинги

  • Бесплатные
  • Самые дешёвые
  • Работают в РФ
  • Для программистов
  • Для рассуждений
  • Длинный контекст
  • Все рейтинги →

Контент

  • Статьи и гайды
  • Сообщество
  • Сравнения моделей
  • Хронология моделей
  • Словарь ИИ
  • Инструменты
  • GPT-чат

О проекте

  • О проекте
  • Редакция
  • Правила сайта
  • Политика конфиденциальности
  • Cookies

© 2026 Shtruzel — Все права защищены

Сделано с ♥ для всех, кто интересуется ИИ

Защита от ботов — SmartCaptcha от Yandex Cloud

ГлавнаяСообщество
Все сравнения

Gemini 3.1 Pro vs MAI-Transcribe-1 — сравнение бенчмарков

Gemini 3.1 Pro
Google
MAI-Transcribe-1
Microsoft
Победитель
MAI-Transcribe-1

MAI-Transcribe-1 специализируется на транскрипции и превосходит Gemini 3.1 Pro в точности распознавания речи. Gemini лидирует как универсальная языковая модель.

Бенчмарки

WER (Word Error Rate, %)
Gemini
6
MAI-Transcribe-1
3
MMLU
Gemini
88
MAI-Transcribe-1
38
Arena Elo (Text)
Gemini
1340
MAI-Transcribe-1
900
Средний балл: Gemini 478vsMAI-Transcribe-1 313.7

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Gemini 3.1 Pro
Google

Флагманская модель Google с контекстом 2 млн токенов и нативной мультимодальностью — текст, изображения, аудио и видео без транскрипции. Лидирует в независимых рейтингах по рассуждениям (GPQA Diamond 94.3%) и ARC-AGI-2. Встроенный sandbox для запуска кода. Лучшее соотношение цена/качество среди фронтирных моделей.

Тарифы, обзор, бенчмарки →
MAI-Transcribe-1
Microsoft

Модель распознавания речи Microsoft. 25 языков включая русский. В 2.5 раза быстрее Azure Fast. Лучший WER на FLEURS, обгоняя Whisper, GPT-Transcribe и Gemini Flash-Lite. Аудиофайлы до 200 МБ.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Gemini умеет транскрибировать аудио?+
Да, Gemini 3.1 Pro мультимодален и может обрабатывать аудио, но MAI-Transcribe-1 точнее как специализированный ASR.
Для каких языков лучше MAI-Transcribe-1?+
MAI-Transcribe-1 особенно силён в английском, немецком, французском. Для русского языка качество хуже Google Speech-to-Text.
Gemini Chirp vs MAI-Transcribe-1?+
Google Chirp (ASR от Google) — прямой конкурент MAI-Transcribe-1. Оба показывают WER около 3-4% на стандартных датасетах.
MAI-Transcribe-1 Microsoft и функция транскрипции Gemini 3.1 Pro конкурируют в сценариях обработки аудиоконтента. WER MAI-Transcribe-1 составляет 3% против 6% у Gemini 3.1 Pro в транскрипции.
Для production-транскрипции MAI-Transcribe-1 предпочтительнее. Gemini 3.1 Pro выигрывает, когда нужна полная обработка: транскрипция плюс суммаризация, извлечение действий и перевод — всё в одном запросе.