Изучаю и тестирую нейросети более 2 лет. Основатель Shtruzel — помогаю разобраться в мире ИИ простым языком.

Комментариев пока нет. Будьте первым!
| 87.6% |
| 88.7% |
| SWE-bench Pro | — | 64.3% | 58.6% |
| Terminal-Bench 2.0 | — | 69.4% | 82.7% |
| CursorBench | 70% | — | — |
SWE-bench Verified — реальные баги из GitHub-репозиториев, починка без подсказок. Codex лидирует на 1.1 пункта. SWE-bench Pro — более сложные задачи на данных вне обучающей выборки. Claude Code выигрывает с отрывом 5.7 пункта. Terminal-Bench 2.0 — многошаговые автономные задачи в реальной оболочке. Codex впереди.
Важная оговорка: SWE-bench Verified сейчас под вопросом у части сообщества — последние модели могли встречать схожие задачи в обучающих данных. SWE-bench Pro считается более честным.
Это самая недооценённая разница. Builder.io провёл независимый тест: одну и ту же задачу Claude Code выполнил за 33 000 токенов без ошибок, Cursor на агентном режиме потратил 188 000 токенов и всё равно получил ошибки.
Практический смысл: на Cursor Pro ($20/мес) тебе доступно 500 Premium requests. Если работаешь с большими кодовыми базами через Agent mode, при таком расходе токенов лимит заканчивается за несколько дней. Про то как работают лимиты и что делать когда они кончились — в нашей статье лимиты Cursor: сколько запросов и когда сбрасываются.
Claude Code за счёт prompt caching и более точного контекстного управления тратит заметно меньше на тех же задачах. Но Claude Code — платишь за токены напрямую через API или подписку, и при интенсивном использовании тоже улетает быстро.
Cursor заявляет 200K контекст. На форуме cursor.com несколько тредов фиксируют, что реально используемый контекст — 70–120K после внутреннего truncation. Для большинства задач хватает. Для больших рефакторингов на крупной кодовой базе — может не хватить.
Claude Code даёт 200K надёжно. 1M токенов — в бета-режиме на Opus 4.6, набрал 76% на MRCR v2 при такой длине. Для работы с монорепозиторием или кодовой базой на десятки файлов — реальное преимущество.
Пишешь фичу прямо сейчас, сидишь за компьютером → Cursor.
Tab autocomplete на Supermaven с задержкой меньше 100ms — лучший в классе. Визуальные диффы, Composer для многофайловых правок, мгновенный фидбэк. Cursor спроектирован под разработчика, который присутствует и хочет контроль. При неоднозначном решении агент остановится и спросит — это не баг, это сознательный выбор команды.
Большой рефакторинг, архитектурные решения, работа с огромной кодовой базой → Claude Code.
1M токен контекст на Opus 4.7, Agent Teams с координирующими субагентами, CLAUDE.md — файл инструкций, который агент читает в каждой сессии. Rakuten подтвердили 99.9% точность на 12.5 миллионах строк кода. Claude Code авторит около 10% всех публичных коммитов на GitHub — ~326 000 в день. Подробнее о возможностях — в нашем хабе Claude Code.
Надо поставить задачу и уйти — пусть делает сам → Codex.
Запускаешь задачу в облачном sandbox, он работает часами или днями без твоего участия, потом ты проверяешь PR. Subagents GA с марта 2026: до 8 параллельных воркеров. Команда codex remote-control для интеграции в CI/CD без GUI. Если задача чётко сформулирована — Codex самый автономный из трёх.
| Инструмент | Бесплатно | Базовый | Продвинутый |
|---|---|---|---|
| Cursor | Hobby: 2K completions, 50 req/мес | Pro: $20/мес | Pro+: $60, Ultra: $200 |
| Claude Code | Нет | Pro: $20/мес | Max: $100, Max 5x: $200 |
| Codex | Нет отдельного | Входит в ChatGPT Plus $20/мес | ChatGPT Pro: $200/мес |
Все три флагманских плана стоят $20/мес. Разница — в том, что за эти $20 ты получаешь. У Cursor — IDE с подпиской, у Claude Code — токены через Anthropic, у Codex — сессии в ChatGPT облаке.
Оплатить из России напрямую нельзя ни один из трёх: все требуют международную карту. Варианты — в нашем гайде как оплатить Cursor из России.
70% разработчиков в 2026 году используют несколько инструментов одновременно — это данные из опросов на dev-форумах и X.
Самая распространённая комбинация:
Cursor днём — пишешь код, видишь диффы, используешь Tab completion. Claude Code вечером — даёшь сложную задачу, агент делает крупный рефакторинг или пишет тесты пока ты занят другим. Codex на фоне — ставишь рутинные задачи (документация, тест-кейсы, мелкие фичи) и возвращаешься к результату.
Cursor Bugbot и Claude Code через GitHub Actions тоже хорошо дополняют друг друга: Bugbot смотрит в PR баги и безопасность внутри IDE, Claude Code через Actions делает архитектурный ревью на уровне проекта.
Новичок в AI-кодинге → начни с Cursor. Самая низкая кривая входа, визуальный интерфейс, привычная VS Code среда.
Опытный разработчик, много Terminal → Claude Code. Если комфортно в терминале и работаешь с большими кодовыми базами — инструмент создан для тебя.
Нужна максимальная автономность, задачи на ночь → Codex. Формулируй задачи детально, запускай, проверяй утром.
Хочешь попробовать бесплатно → Cursor Hobby, 14-дневный trial на Pro без карты. Это единственный вариант с честным бесплатным входом из трёх.
Если выбираешь ИИ-инструмент для кода и хочешь видеть полный рейтинг по бенчмаркам — смотри наш топ нейросетей для программирования.
Источники:
Сервисы, которые дают доступ ко всем популярным нейросетям через один аккаунт. Подключение из РФ без VPN, оплата картой Мир.

Сотни нейросетей на одном балансе — без подписок и автоплатежей. Pay-as-you-go с 2019 года, работает без VPN, есть API и ЭДО для бизнеса.

100+ нейросетей в одной подписке: ChatGPT, Claude, Midjourney, Sora 2 и Suno из Telegram или с сайта - без VPN, в рублях.

ChatGPT, Claude, Gemini, DeepSeek и Grok в одной подписке — на русском, без VPN, с мобильным приложением для iOS и Android.
30+ готовых промптов для ChatGPT на русском: учёба, работа, фото, тексты, резюме, английский. Копируй, подставляй данные, используй. Плюс формула идеального промпта, по которой соберёшь свой.
DALL-E 3 выключен 12 мая, Sora закрылась 26 апреля. Актуальный расклад: GPT Image 2, Nano Banana Pro (2 фото/день free), FLUX.2, Midjourney V8.1. Kandinsky 6.0 и Шедеврум — бесплатно из России без VPN. Kling 3.0 — 66 кредитов в день для оживления фото
45% отказов в пиковые часы, многодневный аутаж в феврале, два открытых бага в GitHub с priority/p1. Разбираем почему Gemini 3 Pro Image API нестабилен, что такое 503 и как защитить приложение с помощью retry логики и fallback моделей.