Claude Haiku 4.5 vs Mistral Large 3 — сравнение бенчмарков
Mistral Large 3 превосходит Claude Haiku 4.5 по качеству рассуждений при конкурентной цене, хотя Haiku быстрее для простых задач.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Claude Haiku 4.5 и Mistral Large 3 конкурируют в среднем ценовом сегменте LLM. Mistral Large 3 — флагман французской компании Mistral AI, обеспечивающий высокое качество при умеренной стоимости. По MMLU Mistral превосходит Haiku: 87 vs 82.
Mistral Large 3 лидирует на HumanEval (83 vs 74) и MATH (76 vs 68). Arena Elo 1265 против 1210. При цене $2 за 1М токенов Mistral дороже Haiku ($0.8), но дешевле Sonnet. Для задач, где важны рассуждение и точность, Mistral Large 3 оправдывает доплату.
Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.
Тарифы, обзор, бенчмарки →Открытая европейская модель: MoE 675B параметров (41B активных), контекст 262K токенов, лицензия Apache 2.0. Сопоставима с GPT-4o при цене API в 4 раза ниже.
Тарифы, обзор, бенчмарки →