🧠 Мультимодальная💬 Текст💻 Код API Open Source

Llama 3.1 405B

MetaДата выхода: 23 июл 2024Контекст: 128K токенов Сайт

Крупнейшая открытая языковая модель от Meta с 405 миллиардами параметров. Сопоставима с GPT-4 по возможностям при полной открытости весов.

—

Тарифы

API

$—

Together.ai, Fireworks AI, Replicate, AWS Bedrock, Azure

Бесплатно

Ограниченный бесплатный доступ через Together.ai

Платный

$—

От $3 за 1М входящих токенов на Together.ai

Плюсы и минусы

Плюсы

Крупнейшая в мире открытая языковая модель (405B параметров)
Качество на уровне GPT-4 при полной открытости исходного кода
Контекст 128K токенов для длинных документов и диалогов
Поддержка коммерческого использования по Meta Llama License
Доступна в облаке через AWS Bedrock и Azure без самостоятельного развёртывания

Минусы

Требует огромных вычислительных ресурсов для локального запуска (8×A100 80GB)
Высокая стоимость API-вызовов по сравнению с моделями меньшего размера
Медленный инференс из-за огромного размера модели
Галлюцинации при работе со свежими событиями (обрезка данных — начало 2024)

Подробный обзор

Вопросы и ответы

Где можно попробовать Llama 3.1 405B бесплатно?+

Together.ai предоставляет ограниченный бесплатный доступ к модели. Также можно воспользоваться демо на HuggingFace Spaces. Для регулярного использования потребуется платная подписка.

Чем Llama 3.1 405B лучше версии 70B?+

405B значительно превосходит 70B в сложных задачах: математике, программировании, многоступенчатых рассуждениях. Однако для большинства повседневных задач разница несущественна, а стоимость и скорость у 70B значительно лучше.

Можно ли использовать Llama 3.1 405B в коммерческих продуктах?+

Да, Meta Llama 3.1 Community License разрешает коммерческое использование компаниям с аудиторией до 700 миллионов пользователей. Более крупные компании должны запросить отдельную лицензию у Meta.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Используете Llama 3.1 405B?

Поделитесь опытом в нашем сообществе

Написать пост