Все сравнения

MAI-Transcribe-1 vs MAI-Voice-1 — сравнение бенчмарков

Ничья

MAI-Transcribe-1 распознаёт речь (STT), MAI-Voice-1 синтезирует речь (TTS) — взаимодополняющие модели Microsoft AI.

Бенчмарки

WER транскрипции (%)
MAI-Transcribe-1
3.8
MAI-Voice-1
0
MOS качество TTS
MAI-Transcribe-1
0
MAI-Voice-1
4.4
Поддержка языков
MAI-Transcribe-1
100
MAI-Voice-1
40
Средний балл: MAI-Transcribe-1 34.6vsMAI-Voice-1 14.8

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

MAI-Transcribe-1 и MAI-Voice-1 — взаимодополняющие компоненты речевого AI от Microsoft. MAI-Transcribe-1 обеспечивает распознавание речи с WER 3.8%, MAI-Voice-1 — синтез с MOS 4.4.

Эти модели созданы для совместного использования: MAI-Transcribe-1 принимает голосовой ввод и конвертирует в текст, языковая модель обрабатывает запрос, MAI-Voice-1 озвучивает ответ.

Вместе они образуют полный пайплайн голосового AI-ассистента. Оба доступны через Azure AI Services с гибкими тарифами.

Вопросы и ответы

В чём разница MAI-Transcribe-1 и MAI-Voice-1?+
MAI-Transcribe-1 переводит речь в текст (STT), MAI-Voice-1 переводит текст в речь (TTS).
Можно ли их использовать вместе?+
Да, это классическая связка: MAI-Transcribe-1 слушает и транскрибирует, MAI-Voice-1 озвучивает ответ.
Какое качество транскрипции у MAI-Transcribe-1?+
WER 3.8% на чистом аудио, поддерживает 100+ языков включая русский.