💬 Текст💻 Код🧠 Мультимодальная API Open Source

Llama 3.3 70B

MetaДата выхода: 6 дек 2024Контекст: 128K токенов Сайт

Мощная открытая языковая модель от Meta с 70 миллиардами параметров и контекстом 128K токенов. Поддерживает работу с кодом и многомодальные задачи.

—

Тарифы

API

$—

Доступно через Together.ai, Groq, Fireworks AI

Бесплатно

Бесплатно через Together.ai и Groq

Платный

$—

От $0.06 за 1М токенов на Together.ai

Плюсы и минусы

Плюсы

Полностью открытый исходный код — можно запустить локально
Бесплатный доступ через Together.ai и Groq
Контекст 128K токенов — достаточно для длинных документов
Отличное соотношение качества и размера среди открытых моделей
Поддержка более 8 языков включая русский

Минусы

Уступает GPT-4o и Claude Sonnet в сложных рассуждениях
Требует значительных ресурсов при локальном запуске
Галлюцинации при работе с узкоспециализированными темами
Ограниченные мультимодальные возможности по сравнению с топовыми моделями

Подробный обзор

Вопросы и ответы

Чем Llama 3.3 70B отличается от Llama 3.1 70B?+

Llama 3.3 70B — улучшенная версия модели того же размера. Она демонстрирует лучшее следование инструкциям, более точные ответы и улучшенную работу с кодом. По многим показателям 70B версия 3.3 сопоставима с Llama 3.1 405B при значительно меньшем размере.

Можно ли запустить Llama 3.3 70B на обычном компьютере?+

Для запуска в полной точности требуется около 140 ГБ видеопамяти. Однако с квантизацией 4-bit через Ollama модель можно запустить на системе с 48 ГБ VRAM, например на двух картах RTX 3090.

Поддерживает ли модель русский язык?+

Да, Llama 3.3 70B обучена на многоязычных данных и поддерживает русский язык. Качество работы на русском хорошее, хотя и несколько ниже, чем на английском — это типично для большинства открытых моделей.

Похожие модели

Текст

Yi-Lightning

01.AI

Высокоскоростная языковая модель от 01.AI с оптимизированным инференсом и контекстным окном 16K токенов. Одна из самых быстрых и дешёвых моделей в классе.

Бесплатно

Мультимодальная

GPT-5.4

OpenAI

Флагманская модель OpenAI с контекстным окном в 1 млн токенов. Лидирует в рейтингах по комплексным задачам: рассуждения, анализ, генерация кода и работа с длинными документами. Доступна в версиях Standard, Thinking и Pro. Поддерживает текст, изображения и код. На 33% меньше галлюцинаций по сравнению с GPT-5.2

Бесплатно

Мультимодальная

Muse Spark

Cursor Agent

Cursor

Автономный ИИ-агент для разработки, встроенный в Cursor IDE. Выполняет многоэтапные задачи: от написания кода до запуска тестов и исправления ошибок. Поддерживает Claude, GPT и другие модели.

Бесплатно

Код

Windsurf

Cognition AI

AI-среда разработки на базе VS Code. Cascade — агентный AI для многошаговых задач. Собственные модели SWE-1/SWE-1.5. Безлимитное автодополнение на всех тарифах. Совместимость с расширениями VS Code. Claude, GPT-4o и другие модели.

Бесплатно

Используете Llama 3.3 70B?

Поделитесь опытом в нашем сообществе

Написать пост