💬 Текст💻 Код🧠 Мультимодальная API Open Source

Phi-4

MicrosoftДата выхода: 12 дек 2024Контекст: 16K Сайт

Компактная языковая модель Microsoft с 14 млрд параметров и впечатляющими возможностями. Открытый исходный код, высокие показатели в математике и рассуждениях при малом размере.

—

Тарифы

Бесплатно

false

input

$—

$0.07 за 1M токенов

output

$—

$0.14 за 1M токенов

azureNote

$—

Доступна через Azure AI Studio

Плюсы и минусы

Плюсы

Всего 14B параметров, работает на одной A100 или мощных потребительских GPU
Открытый исходный код под лицензией MIT
Лидирующие показатели среди моделей до 14B параметров по математике
Эффективное обучение на синтетических данных высокого качества
Очень низкая стоимость API через Azure — от $0.07 за 1M токенов

Минусы

Контекстное окно 16K ограничивает работу с длинными документами
Значительно уступает крупным моделям по широте знаний
Слабее в задачах с мультиязычностью, особенно на не-английских языках
Ограниченные инструкционные возможности по сравнению с RLHF-моделями

Подробный обзор

Вопросы и ответы

В чём секрет высокой производительности Phi-4 при малом размере?+

Microsoft использовала метод обучения на синтетически сгенерированных данных — специально созданных примерах задач и решений в области математики, науки и программирования. Такие данные более информативны, чем сырые тексты из интернета, что позволило 14B-модели превзойти более крупные аналоги на ключевых бенчмарках.

Можно ли запустить Phi-4 локально?+

Да, Phi-4 можно запустить локально через Ollama командой ollama run phi4, через LM Studio или напрямую через Hugging Face Transformers. В полном формате float16 требуется GPU с 28 ГБ VRAM. С квантизацией Q4 требования снижаются до 8–10 ГБ — это позволяет запустить модель на RTX 3080.

Подходит ли Phi-4 для работы с русским языком?+

Phi-4 понимает русский язык и может выполнять базовые задачи, однако её русскоязычные возможности значительно слабее английских. Для задач, требующих грамотного русского текста, лучше выбрать GigaChat, YandexGPT или мультиязычные Claude и GPT.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Используете Phi-4?

Поделитесь опытом в нашем сообществе

Написать пост