Каталог моделей
💬 Текст💻 Код🧠 Мультимодальная API Open Source

Phi-4

MicrosoftДата выхода: 12 дек 2024Контекст: 16K Сайт

Компактная языковая модель Microsoft с 14 млрд параметров и впечатляющими возможностями. Открытый исходный код, высокие показатели в математике и рассуждениях при малом размере.

Тарифы

Бесплатно
Бесплатно
  • false
input
$—
  • $0.07 за 1M токенов
output
$—
  • $0.14 за 1M токенов
azureNote
$—
  • Доступна через Azure AI Studio

Плюсы и минусы

Плюсы

  • Всего 14B параметров, работает на одной A100 или мощных потребительских GPU
  • Открытый исходный код под лицензией MIT
  • Лидирующие показатели среди моделей до 14B параметров по математике
  • Эффективное обучение на синтетических данных высокого качества
  • Очень низкая стоимость API через Azure — от $0.07 за 1M токенов

Минусы

  • Контекстное окно 16K ограничивает работу с длинными документами
  • Значительно уступает крупным моделям по широте знаний
  • Слабее в задачах с мультиязычностью, особенно на не-английских языках
  • Ограниченные инструкционные возможности по сравнению с RLHF-моделями

Подробный обзор

Phi-4 — языковая модель компании Microsoft из серии Phi, которая демонстрирует, что небольшие модели при правильном подходе к обучению могут конкурировать с гораздо более крупными аналогами. Модель содержит 14 миллиардов параметров и распространяется под открытой лицензией MIT.

Ключевое отличие Phi-4 от конкурентов — ставка на качество обучающих данных вместо увеличения размера модели. Microsoft использовала большой объём синтетически сгенерированных данных, специально созданных для обучения логическому мышлению, математике и программированию. Это позволило достичь результатов, превосходящих модели в 3–5 раз большего размера.

На бенчмарке MATH (олимпийская математика) Phi-4 набирает 80.4%, опережая значительно более крупные модели, включая Llama 3.1 70B. На GPQA Diamond (сложные вопросы по физике, химии, биологии) результат составляет 56.1% — сопоставимо с GPT-4o Mini при гораздо меньшем размере.

Phi-4 поддерживает мультимодальный ввод: модель может анализировать изображения, графики, таблицы и математические выражения в визуальной форме. Это открывает возможности для образовательных приложений, автоматической проверки решений и анализа научных материалов.

Для разработчиков Phi-4 доступна через Azure AI Studio, Hugging Face и Ollama для локального запуска. На современном ПК с GPU NVIDIA RTX 4070 или выше модель работает с приемлемой скоростью без квантизации.

Вопросы и ответы

В чём секрет высокой производительности Phi-4 при малом размере?+
Microsoft использовала метод обучения на синтетически сгенерированных данных — специально созданных примерах задач и решений в области математики, науки и программирования. Такие данные более информативны, чем сырые тексты из интернета, что позволило 14B-модели превзойти более крупные аналоги на ключевых бенчмарках.
Можно ли запустить Phi-4 локально?+
Да, Phi-4 можно запустить локально через Ollama командой ollama run phi4, через LM Studio или напрямую через Hugging Face Transformers. В полном формате float16 требуется GPU с 28 ГБ VRAM. С квантизацией Q4 требования снижаются до 8–10 ГБ — это позволяет запустить модель на RTX 3080.
Подходит ли Phi-4 для работы с русским языком?+
Phi-4 понимает русский язык и может выполнять базовые задачи, однако её русскоязычные возможности значительно слабее английских. Для задач, требующих грамотного русского текста, лучше выбрать GigaChat, YandexGPT или мультиязычные Claude и GPT.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно

Используете Phi-4?

Поделитесь опытом в нашем сообществе

Написать пост