Phi-4
Компактная языковая модель Microsoft с 14 млрд параметров и впечатляющими возможностями. Открытый исходный код, высокие показатели в математике и рассуждениях при малом размере.
Тарифы
- false
- $0.07 за 1M токенов
- $0.14 за 1M токенов
- Доступна через Azure AI Studio
Плюсы и минусы
Плюсы
- Всего 14B параметров, работает на одной A100 или мощных потребительских GPU
- Открытый исходный код под лицензией MIT
- Лидирующие показатели среди моделей до 14B параметров по математике
- Эффективное обучение на синтетических данных высокого качества
- Очень низкая стоимость API через Azure — от $0.07 за 1M токенов
Минусы
- Контекстное окно 16K ограничивает работу с длинными документами
- Значительно уступает крупным моделям по широте знаний
- Слабее в задачах с мультиязычностью, особенно на не-английских языках
- Ограниченные инструкционные возможности по сравнению с RLHF-моделями
Подробный обзор
Phi-4 — языковая модель компании Microsoft из серии Phi, которая демонстрирует, что небольшие модели при правильном подходе к обучению могут конкурировать с гораздо более крупными аналогами. Модель содержит 14 миллиардов параметров и распространяется под открытой лицензией MIT.
Ключевое отличие Phi-4 от конкурентов — ставка на качество обучающих данных вместо увеличения размера модели. Microsoft использовала большой объём синтетически сгенерированных данных, специально созданных для обучения логическому мышлению, математике и программированию. Это позволило достичь результатов, превосходящих модели в 3–5 раз большего размера.
На бенчмарке MATH (олимпийская математика) Phi-4 набирает 80.4%, опережая значительно более крупные модели, включая Llama 3.1 70B. На GPQA Diamond (сложные вопросы по физике, химии, биологии) результат составляет 56.1% — сопоставимо с GPT-4o Mini при гораздо меньшем размере.
Phi-4 поддерживает мультимодальный ввод: модель может анализировать изображения, графики, таблицы и математические выражения в визуальной форме. Это открывает возможности для образовательных приложений, автоматической проверки решений и анализа научных материалов.
Для разработчиков Phi-4 доступна через Azure AI Studio, Hugging Face и Ollama для локального запуска. На современном ПК с GPU NVIDIA RTX 4070 или выше модель работает с приемлемой скоростью без квантизации.