Компактная языковая модель Microsoft с 14 млрд параметров и впечатляющими возможностями. Открытый исходный код, высокие показатели в математике и рассуждениях при малом размере.
—
Тарифы
Бесплатно
Бесплатно
false
input
$—
$0.07 за 1M токенов
output
$—
$0.14 за 1M токенов
azureNote
$—
Доступна через Azure AI Studio
Плюсы и минусы
Плюсы
Всего 14B параметров, работает на одной A100 или мощных потребительских GPU
Открытый исходный код под лицензией MIT
Лидирующие показатели среди моделей до 14B параметров по математике
Эффективное обучение на синтетических данных высокого качества
Очень низкая стоимость API через Azure — от $0.07 за 1M токенов
Минусы
Контекстное окно 16K ограничивает работу с длинными документами
Значительно уступает крупным моделям по широте знаний
Слабее в задачах с мультиязычностью, особенно на не-английских языках
Ограниченные инструкционные возможности по сравнению с RLHF-моделями
Подробный обзор
Вопросы и ответы
В чём секрет высокой производительности Phi-4 при малом размере?+
Microsoft использовала метод обучения на синтетически сгенерированных данных — специально созданных примерах задач и решений в области математики, науки и программирования. Такие данные более информативны, чем сырые тексты из интернета, что позволило 14B-модели превзойти более крупные аналоги на ключевых бенчмарках.
Можно ли запустить Phi-4 локально?+
Да, Phi-4 можно запустить локально через Ollama командой ollama run phi4, через LM Studio или напрямую через Hugging Face Transformers. В полном формате float16 требуется GPU с 28 ГБ VRAM. С квантизацией Q4 требования снижаются до 8–10 ГБ — это позволяет запустить модель на RTX 3080.
Подходит ли Phi-4 для работы с русским языком?+
Phi-4 понимает русский язык и может выполнять базовые задачи, однако её русскоязычные возможности значительно слабее английских. Для задач, требующих грамотного русского текста, лучше выбрать GigaChat, YandexGPT или мультиязычные Claude и GPT.
Phi-4 — языковая модель компании Microsoft из серии Phi, которая демонстрирует, что небольшие модели при правильном подходе к обучению могут конкурировать с гораздо более крупными аналогами. Модель содержит 14 миллиардов параметров и распространяется под открытой лицензией MIT.
Ключевое отличие Phi-4 от конкурентов — ставка на качество обучающих данных вместо увеличения размера модели. Microsoft использовала большой объём синтетически сгенерированных данных, специально созданных для обучения логическому мышлению, математике и программированию. Это позволило достичь результатов, превосходящих модели в 3–5 раз большего размера.
На бенчмарке MATH (олимпийская математика) Phi-4 набирает 80.4%, опережая значительно более крупные модели, включая Llama 3.1 70B. На GPQA Diamond (сложные вопросы по физике, химии, биологии) результат составляет 56.1% — сопоставимо с GPT-4o Mini при гораздо меньшем размере.
Phi-4 поддерживает мультимодальный ввод: модель может анализировать изображения, графики, таблицы и математические выражения в визуальной форме. Это открывает возможности для образовательных приложений, автоматической проверки решений и анализа научных материалов.
Для разработчиков Phi-4 доступна через Azure AI Studio, Hugging Face и Ollama для локального запуска. На современном ПК с GPUNVIDIA RTX 4070 или выше модель работает с приемлемой скоростью без квантизации.
Phi-4 от Microsoft — компактная открытая модель 14B для математики и кода