GigaChat 2.0 vs MAI-Transcribe-1 — сравнение бенчмарков

Ничья

GigaChat 2.0 и MAI-Transcribe-1 дополняют друг друга: GigaChat обрабатывает и генерирует текст, MAI-Transcribe-1 превращает речь в текст. Для работы с аудио в связке это идеальный дуэт.

Бенчмарки

Русский MMLU

GigaChat

88.1

MAI-Transcribe-1

WER (русский)

GigaChat

MAI-Transcribe-1

6.8

WER (английский)

GigaChat

MAI-Transcribe-1

4.2

Средний балл: GigaChat 29.4vsMAI-Transcribe-1 3.7

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Тарифы, обзор, бенчмарки →

MAI-Transcribe-1

Microsoft

Модель распознавания речи Microsoft. 25 языков включая русский. В 2.5 раза быстрее Azure Fast. Лучший WER на FLEURS, обгоняя Whisper, GPT-Transcribe и Gemini Flash-Lite. Аудиофайлы до 200 МБ.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Может ли GigaChat 2.0 распознавать речь?+

GigaChat 2.0 в базовой версии не транскрибирует аудио. Для этого используется отдельный сервис SaluteSpeech от Сбера.

MAI-Transcribe-1 хорошо работает с русским?+

Да, MAI-Transcribe-1 поддерживает русский язык и показывает WER 6.8%, что является хорошим результатом для российского рынка.

Как создать русскоязычный голосовой бот?+

MAI-Transcribe-1 преобразует речь в текст, GigaChat 2.0 генерирует ответ на русском языке. Связка этих инструментов даёт отличный результат.

Есть ли российские аналоги MAI-Transcribe-1?+

Да, Яндекс SpeechKit и SaluteSpeech от Сбера предлагают транскрипцию с хорошим качеством для русского языка.