IDE-агент Anthropic: работает в терминале, читает код, пишет правки, гоняет тесты. Строится на моделях Claude Opus, Sonnet и Haiku.
DeepSeek V4 выигрывает за счёт бесплатного доступа, open-source кода и цен API в 50 раз ниже Claude Opus 4.7 при сопоставимых бенчмарках и 1M контексте. Для большинства задач, особенно с большими объёмами, экономия перевешивает небольшое преимущество Claude в точности.
Claude Opus 4.7 превосходит GPT-5.4 в ключевых бенчмарках по программированию и агентным задачам, таких как SWE-bench, с меньшим уровнем ошибок и галлюцинаций. Это делает её предпочтительной для сложного кодинга и многошаговых сценариев.
Claude Opus 4.7 — значительный прогресс в кодировании и агентных задачах с 13% улучшением на бенчмарках, 2x сокращением вызовов моделей и 24% ускорением выполнения задач при той же цене.
Anthropic 16 апреля 2026 года выпустила Claude Opus 4.7, новый флагман линейки. Модель превосходит Opus 4.6, GPT-5.4 и Gemini 3.1 Pro по ключевым бенчмаркам, обрабатывает изображения до 2576 пикселей, умеет верифицировать собственный вывод и работать с памятью между сессиями. Появился новый уровень рассуждений xhigh, улучшена работа в агентных сценариях. Цены не изменились: $5 за миллион входных токенов и $25 за выходные. Доступна в Claude, API, Bedrock, Vertex AI, Foundry и GitHub Copilot.
Claude Sonnet 4.6 превосходит по международным бенчмаркам. YandexGPT 5 Pro лучше для задач на русском языке и в экосистеме Яндекса.
Claude Sonnet 4.6 лучше для анализа и объяснений. Windsurf эффективнее в автономном управлении кодовыми проектами в IDE.