Модель генерации речи Microsoft. Естественная выразительная речь с сохранением голоса. 60 секунд аудио за 1 секунду. Клонирование голоса из 10-секундного образца через Azure Personal Voice. Интеграция в Copilot для подкастов.

Тарифы, обзор, бенчмарки →

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

Qwen 3 может озвучивать текст?+

Базовая Qwen 3 — языковая модель для текста. Для синтеза речи используйте MAI-Voice-1 или аналогичные TTS-модели.

Как использовать их в голосовом ассистенте?+

Qwen 3 (с MMLU 87.1%) обрабатывает запросы и генерирует ответы, MAI-Voice-1 озвучивает их с MOS 4.4.

Qwen 3 поддерживает китайский язык?+

Да, Qwen 3 отлично работает с китайским, MAI-Voice-1 также поддерживает китайский для синтеза речи.