Каталог моделей
💬 Текст💻 Код🧠 Мультимодальная API Open Source

Llama 3.3 70B

MetaДата выхода: 6 дек 2024Контекст: 128K токенов Сайт

Мощная открытая языковая модель от Meta с 70 миллиардами параметров и контекстом 128K токенов. Поддерживает работу с кодом и многомодальные задачи.

Тарифы

API
$—
  • Доступно через Together.ai, Groq, Fireworks AI
Бесплатно
Бесплатно
  • Бесплатно через Together.ai и Groq
Платный
$—
  • От $0.06 за 1М токенов на Together.ai

Плюсы и минусы

Плюсы

  • Полностью открытый исходный код — можно запустить локально
  • Бесплатный доступ через Together.ai и Groq
  • Контекст 128K токенов — достаточно для длинных документов
  • Отличное соотношение качества и размера среди открытых моделей
  • Поддержка более 8 языков включая русский

Минусы

  • Уступает GPT-4o и Claude Sonnet в сложных рассуждениях
  • Требует значительных ресурсов при локальном запуске
  • Галлюцинации при работе с узкоспециализированными темами
  • Ограниченные мультимодальные возможности по сравнению с топовыми моделями

Подробный обзор

Llama 3.3 70B — флагманская открытая языковая модель компании Meta, выпущенная в декабре 2024 года. Модель содержит 70 миллиардов параметров и представляет собой значительный шаг вперёд в развитии открытых языковых моделей, вплотную приблизившись по качеству к закрытым коммерческим решениям.

Ключевое преимущество Llama 3.3 70B — поддержка контекстного окна в 128 000 токенов. Это позволяет обрабатывать длинные документы, книги, большие кодовые базы и вести многоходовые диалоги без потери контекста. Модель обучена на многоязычных данных и демонстрирует хорошие результаты в том числе на русском языке.

Для разработчиков Llama 3.3 70B доступна через несколько платформ: Together.ai и Groq предоставляют бесплатный API-доступ в рамках лимитов, Fireworks AI и Replicate предлагают платное использование с конкурентными ценами. Модель можно также запустить локально с помощью Ollama или vLLM при наличии достаточного объёма видеопамяти.

В бенчмарках MMLU модель набирает около 86 баллов, что сопоставимо с GPT-3.5 Turbo и превосходит большинство открытых аналогов. В задачах программирования на HumanEval показатель составляет около 72%, что делает её пригодной для помощи в разработке. Модель хорошо справляется с анализом текстов, написанием контента, структурированием данных.

Llama 3.3 70B лицензирована под Meta Llama 3.3 Community License, которая разрешает коммерческое использование компаниям с аудиторией до 700 миллионов пользователей. Веса модели доступны для скачивания на HuggingFace и официальном сайте Meta.

Вопросы и ответы

Чем Llama 3.3 70B отличается от Llama 3.1 70B?+
Llama 3.3 70B — улучшенная версия модели того же размера. Она демонстрирует лучшее следование инструкциям, более точные ответы и улучшенную работу с кодом. По многим показателям 70B версия 3.3 сопоставима с Llama 3.1 405B при значительно меньшем размере.
Можно ли запустить Llama 3.3 70B на обычном компьютере?+
Для запуска в полной точности требуется около 140 ГБ видеопамяти. Однако с квантизацией 4-bit через Ollama модель можно запустить на системе с 48 ГБ VRAM, например на двух картах RTX 3090.
Поддерживает ли модель русский язык?+
Да, Llama 3.3 70B обучена на многоязычных данных и поддерживает русский язык. Качество работы на русском хорошее, хотя и несколько ниже, чем на английском — это типично для большинства открытых моделей.

Похожие модели

Текст

GigaChat 2.0

Сбер

Флагманская российская языковая модель от Сбера. Контекст 128K токенов, долговременная память, встроенный интерпретатор кода и автономный веб-поиск. Лучшее понимание русского языка среди всех моделей.

Бесплатно
Текст

Qwen 3

Alibaba Cloud

Серия LLM от Alibaba с гибридным рассуждением. 8 моделей: 6 плотных (0.6B-32B) и 2 MoE (30B/3B, 235B/22B). 36 трлн токенов обучения, 119 языков. Думающий режим для сложных задач, быстрый для простых. Apache 2.0.

$0.05/1M input
Мультимодальная

Claude Sonnet 4.6

Anthropic

Оптимальная модель Anthropic по соотношению цены и качества из семейства Claude 4.6. Приближается к Opus по интеллекту при значительно меньшей стоимости. Отлично справляется с кодингом, анализом документов, агентными задачами и computer use. Контекст 1M токенов, до 64K токенов на выходе. Идеальна для повседневных рабочих задач, где нужен баланс между скоростью, качеством и ценой.

$20/мес
Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно
Мультимодальная

Muse Spark

Meta

Первая закрытая модель Meta от Superintelligence Labs. Мультимодальная модель рассуждений: текст, изображения, речь. Уникальный Contemplating Mode — мульти-агентная параллельная система. Три режима: Instant, Thinking, Contemplating. Бесплатно через meta.ai.

Бесплатно

Используете Llama 3.3 70B?

Поделитесь опытом в нашем сообществе

Написать пост