Claude Haiku 4.5 vs GigaChat 2.0 — сравнение бенчмарков
Claude Haiku 4.5 превосходит GigaChat 2.0 по международным бенчмаркам, но GigaChat выигрывает по работе с русским языком и соответствию российскому законодательству.
Бенчмарки
* Бенчмарки — стандартизированные тесты для оценки качества ИИ-моделей. Чем выше балл, тем лучше модель справляется с задачей.
Claude Haiku 4.5 и GigaChat 2.0 — модели, ориентированные на разные рынки. GigaChat от Сбербанка создан специально для русскоязычных пользователей и корпоративных клиентов в России, соответствует требованиям 152-ФЗ и хранит данные внутри страны.
По международным бенчмаркам Haiku 4.5 лидирует: MMLU 82 vs 71, HumanEval 74 vs 62. GigaChat 2.0 лучше понимает русскоязычный контекст, знает российское законодательство и культуру. Для российских корпоративных проектов GigaChat предпочтительнее из-за соответствия нормативным требованиям.
Быстрая и экономичная модель Anthropic. 200K контекст, до 64K выход. Extended thinking, computer use, context awareness. Производительность уровня Claude Sonnet 4 в 3 раза дешевле. Скорость в 4-5 раз выше Sonnet 4.5.
Тарифы, обзор, бенчмарки →Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.
Тарифы, обзор, бенчмарки →