Claude Fable 5 лучше для большинства сложных задач: он заметно сильнее в кодинге, агентских сценариях и reasoning по свежим бенчмаркам. Gemini 3.1 Pro выигрывает по цене и контексту, но по суммарной производительности чаще уступает.
Gemini 3.1 Pro опережает GLM-5.1 по большинству международных бенчмарков и мультимодальным возможностям. GLM-5.1 сильнее в задачах на китайском языке.
FLUX 2.0 Ultra превосходит Gemini 3.1 Pro в качестве генерируемых изображений. Gemini сильнее как мультимодальная модель для анализа и работы с текстом.
Cursor Agent эффективнее в IDE-задачах. Gemini 3.1 Pro мощнее как мультимодальная модель Google с длинным контекстом.
Gemini 3.1 Pro лидирует по общим бенчмаркам. Qwen 3 от Alibaba — сильный конкурент с превосходством на китайском языке и открытыми весами.