Все сравнения

GigaChat 2.0 vs MAI-Transcribe-1 — сравнение бенчмарков

Ничья

GigaChat 2.0 и MAI-Transcribe-1 дополняют друг друга: GigaChat обрабатывает и генерирует текст, MAI-Transcribe-1 превращает речь в текст. Для работы с аудио в связке это идеальный дуэт.

Бенчмарки

Русский MMLU
GigaChat
88.1
MAI-Transcribe-1
0
WER (русский)
GigaChat
0
MAI-Transcribe-1
6.8
WER (английский)
GigaChat
0
MAI-Transcribe-1
4.2
Средний балл: GigaChat 29.4vsMAI-Transcribe-1 3.7

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

GigaChat 2.0 от Сбербанка специализируется на обработке русскоязычного текста. MAI-Transcribe-1 от Microsoft — система распознавания речи с поддержкой 100+ языков, включая русский.

GigaChat 2.0 демонстрирует Русский MMLU 88.1% в задачах понимания русского языка. MAI-Transcribe-1 показывает WER 4.2% для английского и 6.8% для русского — конкурентные показатели для корпоративных ASR-систем.

Для российских предприятий, разрабатывающих голосовые интерфейсы на русском языке, связка MAI-Transcribe-1 (ввод) и GigaChat 2.0 (обработка) представляет собой эффективную архитектуру с уклоном на русский язык.

Вопросы и ответы

Может ли GigaChat 2.0 распознавать речь?+
GigaChat 2.0 в базовой версии не транскрибирует аудио. Для этого используется отдельный сервис SaluteSpeech от Сбера.
MAI-Transcribe-1 хорошо работает с русским?+
Да, MAI-Transcribe-1 поддерживает русский язык и показывает WER 6.8%, что является хорошим результатом для российского рынка.
Как создать русскоязычный голосовой бот?+
MAI-Transcribe-1 преобразует речь в текст, GigaChat 2.0 генерирует ответ на русском языке. Связка этих инструментов даёт отличный результат.
Есть ли российские аналоги MAI-Transcribe-1?+
Да, Яндекс SpeechKit и SaluteSpeech от Сбера предлагают транскрипцию с хорошим качеством для русского языка.