Штруцель
Сообщество
Статьи
Новости
Свежие релизы и обновления
Статьи
Аналитика и разборы
Гайды
Пошаговые инструкции
Обзоры
Сравнения и тесты
Туториалы
Практические уроки
Модели
Текстовые
GPT, Claude, Gemini и другие
Изображения
Midjourney, DALL-E, FLUX
Код
Copilot, Cursor, Windsurf
Видео
Sora, Runway, Kling
Музыка
Suno, Udio
Инструменты
Генератор промптов
Для ChatGPT, Claude, Midjourney
Переводчик ошибок
Объяснение на русском
Рерайтер текста
Перефразирование с ИИ
GPT-чат
Бесплатно, без VPN
Промпт-Баттл
Два ИИ спорят
SEO-аудит
Проверка сайта
Хабы
Claude Code
IDE-агент Anthropic
ChatGPT
OpenAI GPT-5
Midjourney
Генерация картинок
Cursor
AI-IDE
Gemini
Google AI
Все хабы
16 брендов ИИ
Рейтинги
Бесплатные
ИИ с бесплатным доступом
Бюджетные
Самые дешёвые по $/1M
Работают в РФ
Без VPN и иностранной карты
Для кода
По SWE-Bench и HumanEval
Для картинок
Midjourney, FLUX, DALL-E
Для видео
Sora, Veo, Kling, Runway
Для музыки
Suno, Udio, MusicGen
Для голоса
ElevenLabs, Whisper
Все рейтинги
15 подборок по задачам
Аналитика
Сравнение моделей
Бенчмарки, цены, вердикт
Хронология моделей
Таймлайн и граф релизов
Shtruzel
Сообщество
Новости
Статьи
Модели
Инструменты
Рейтинги
Аналитика
Сервисы
Хабы16
Claude CodeChatGPTCursorMidjourneyElevenLabsGeminiGitHub CopilotWindsurfPerplexityGrokYandexGPTGigaChatStable DiffusionFLUXDeepSeekKling
Тёмная тема
ShtruzelShtruzel

Каталог, рейтинги и обзоры нейросетей. Бенчмарки, цены, возможности 70+ AI-моделей.

info@shtruzel.ruTelegram-канал

Каталог

  • Для текста
  • Для картинок
  • Для видео
  • Для музыки
  • Для голоса
  • Для кода
  • Все модели
  • Хабы брендов

Рейтинги

  • Бесплатные
  • Самые дешёвые
  • Работают в РФ
  • Для программистов
  • Для рассуждений
  • Длинный контекст
  • Все рейтинги →

Контент

  • Статьи и гайды
  • Сообщество
  • Сравнения моделей
  • Хронология моделей
  • Словарь ИИ
  • Инструменты
  • GPT-чат

О проекте

  • О проекте
  • Редакция
  • Правила сайта
  • Политика конфиденциальности
  • Cookies

© 2026 Shtruzel — Все права защищены

Сделано с ♥ для всех, кто интересуется ИИ

Защита от ботов — SmartCaptcha от Yandex Cloud

ГлавнаяСообщество
Каталог моделей
🧠 Мультимодальная💬 Текст💻 Код API Open Source

Llama 3.1 405B

MetaДата выхода: 23 июл 2024Контекст: 128K токенов Сайт

Крупнейшая открытая языковая модель от Meta с 405 миллиардами параметров. Сопоставима с GPT-4 по возможностям при полной открытости весов.

—

Тарифы

API
$—
  • Together.ai, Fireworks AI, Replicate, AWS Bedrock, Azure
Бесплатно
Бесплатно
  • Ограниченный бесплатный доступ через Together.ai
Платный
$—
  • От $3 за 1М входящих токенов на Together.ai

Плюсы и минусы

Плюсы

  • Крупнейшая в мире открытая языковая модель (405B параметров)
  • Качество на уровне GPT-4 при полной открытости исходного кода
  • Контекст 128K токенов для длинных документов и диалогов
  • Поддержка коммерческого использования по Meta Llama License
  • Доступна в облаке через AWS Bedrock и Azure без самостоятельного развёртывания

Минусы

  • Требует огромных вычислительных ресурсов для локального запуска (8×A100 80GB)
  • Высокая стоимость API-вызовов по сравнению с моделями меньшего размера
  • Медленный инференс из-за огромного размера модели
  • Галлюцинации при работе со свежими событиями (обрезка данных — начало 2024)

Подробный обзор

Вопросы и ответы

Где можно попробовать Llama 3.1 405B бесплатно?+
Together.ai предоставляет ограниченный бесплатный доступ к модели. Также можно воспользоваться демо на HuggingFace Spaces. Для регулярного использования потребуется платная подписка.
Чем Llama 3.1 405B лучше версии 70B?+
405B значительно превосходит 70B в сложных задачах: математике, программировании, многоступенчатых рассуждениях. Однако для большинства повседневных задач разница несущественна, а стоимость и скорость у 70B значительно лучше.
Можно ли использовать Llama 3.1 405B в коммерческих продуктах?+
Да, Meta Llama 3.1 Community License разрешает коммерческое использование компаниям с аудиторией до 700 миллионов пользователей. Более крупные компании должны запросить отдельную лицензию у Meta.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно
Код

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно
Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Используете Llama 3.1 405B?

Поделитесь опытом в нашем сообществе

Написать пост
Llama 3.1 405B — исторически значимая модель: первая открытая языковая модель, вплотную приблизившаяся по возможностям к закрытым флагманам GPT-4 и Claude 3 Opus. Выпущенная Meta в июле 2024 года, она содержит 405 миллиардов параметров и установила новую планку для открытых моделей.
Модель обучена на наборе данных объёмом более 15 триллионов токенов с дополнительным этапом RLHF. Это обеспечивает высокое качество следования инструкциям, безопасные ответы и способность к сложным многоступенчатым рассуждениям.
В бенчмарке MMLU Llama 3.1 405B достигает 88.6%, что превосходит GPT-4 версии 2023 года и сопоставимо с Claude 3 Opus. На HumanEval для задач программирования модель показывает 89.0%, что является одним из лучших результатов среди открытых моделей.
Для коммерческого развёртывания 405B доступна через AWS Bedrock, Azure Machine Learning и GCP Vertex AI. Для исследователей с достаточными ресурсами доступна самостоятельная установка — для запуска в FP8 точности достаточно 8 видеокарт A100 80GB.
Llama 3.1 405B особенно востребована как базовая модель для дообучения под специализированные задачи. Открытость весов позволяет компаниям создавать собственные модели для медицины, права, финансов без зависимости от внешних API.