Claude Haiku 4.5 vs GigaChat 2.0 — сравнение бенчмарков

Claude Haiku 4.5

Claude Haiku 4.5 превосходит GigaChat 2.0 по международным бенчмаркам, но GigaChat выигрывает по работе с русским языком и соответствию российскому законодательству.

Бенчмарки

MMLU

Claude

GigaChat

HumanEval

Claude

GigaChat

MATH

Claude

GigaChat

Arena Elo

Claude

1210

GigaChat

1130

Средний балл: Claude 358.5vsGigaChat 331.8

* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.

Claude Haiku 4.5

Anthropic

Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.

Тарифы, обзор, бенчмарки →

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Тарифы, обзор, бенчмарки →

Вопросы и ответы

GigaChat лучше для русского языка?+

GigaChat 2.0 специально оптимизирован для русского языка и российского контекста. Haiku 4.5 тоже хорошо работает с русским, но GigaChat тоньше понимает культурные нюансы.

Где хранятся данные при использовании GigaChat?+

GigaChat от Сбера хранит данные на российских серверах и соответствует требованиям 152-ФЗ о персональных данных.

Haiku доступен в России?+

Haiku 4.5 доступен через API Anthropic, однако для российских компаний могут быть ограничения. GigaChat доступен напрямую.

Какая модель лучше для кода?+

По HumanEval Haiku 4.5 значительно лучше: 74 vs 62. Для разработки ПО предпочтителен Haiku.