| Llama 4 Maverick |
Мультимодальная (смесь экспертов, флагманская) |
до 1,000,000 |
17 млрд активных / ~400 млрд всего (128 экспертов) |
Мощная открытая мультимодальная модель; высокие показатели на многих тестах; ~80.5% MMLU Pro, ~69.8% GPQA Diamond, ~90% HumanEval. Рекомендуется для приложений, где важны максимальное качество и мультимодальные возможности. |
- Нативно мультимодальная (вход: текст + изображения, выход: текст)
- Открытые веса (лицензия Llama 4 Community)
- Архитектура «смесь экспертов»; эффективные 17B активных параметров
- Коммерческое использование: для организаций с >700 млн MAU требуется отдельное разрешение Meta
- Доступна через Together.ai, Groq, AWS, Azure, IBM watsonx, Oracle Cloud, Hugging Face и др.
- Интегрирована в Meta AI (WhatsApp, Messenger, Instagram, веб и отдельное приложение Meta AI)
- Лицензия ограничивает прямое использование мультимодальных моделей Llama 4 организациями, зарегистрированными в ЕС
|
вход: $0.27; выход: $0.85 |
документация |
| Llama 4 Scout |
Мультимодальная (смесь экспертов, эффективная, длинный контекст) |
до 10,000,000 |
17 млрд активных / 109 млрд всего (16 экспертов) |
Эффективная мультимодальная модель для периферии и облака; может работать на одном H100 (в квантованных режимах); контекст до 10 млн токенов; баланс качества, стоимости и скорости. Часто используется как выбор для длинного контекста и периферийных сценариев. |
- Нативно мультимодальная
- Открытые веса (лицензия Llama 4 Community)
- Оптимизирована для скорости и развёртывания на периферии и в облаке
- Коммерческие ограничения: дополнительная лицензия для организаций с >700 млн MAU
- Квантование в int4/int8 поддерживается многими фреймворками
- Лицензия запрещает прямое использование мультимодальных моделей Llama 4 разработчикам, зарегистрированным в ЕС; конечные пользователи в ЕС могут получать доступ к сервисам на базе Llama 4, развёрнутым за пределами ЕС
|
вход: $0.18; выход: $0.59 |
документация |
| Llama 4 Behemoth |
Мультимодальная (смесь экспертов, модель-учитель / сверхкрупная) |
не указано (внутренняя модель) |
288 млрд активных / ~2 трлн всего (16 экспертов) |
Сверхкрупная модель, используемая как модель-учитель для Scout/Maverick; по опубликованным тестам показывает передовые результаты на STEM-задачах (82.2% MMLU Pro, 73.7% GPQA, ~88% HumanEval, ~95% MATH-500). По состоянию на начало 2026 года не имеет открытых весов и недоступна для коммерческого использования. |
- Нативно мультимодальная
- Статус: внутренняя модель и ограниченное исследовательское превью; нет публичного API с открытыми весами
- Требует крайне значительных вычислительных ресурсов; рассматривалась как кандидат для будущих флагманских релизов
- Используется для дистилляции и обучения Llama 4 Scout/Maverick
|
не указано |
объявление |
| Meta-Llama-3.3-70B-Instruct |
Текст (открытые веса, оптимизированная) |
до 128,000 |
70 млрд |
Оптимизированная версия семейства 3.x; по качеству близка к Llama 3.1 405B при стоимости и задержке, характерных для 70B; 86.0% MMLU, 88.4% HumanEval, ~77% MATH. Фактически стала стандартной крупной текстовой моделью Llama 3.x у многих провайдеров. |
- Только текстовая модель (текст на входе / текст на выходе)
- Открытые веса (лицензия Llama 3 Community)
- Отличное соотношение цена/качество для текстовых и программных задач
- Поддерживает локальный и облачный вывод моделей, контекст до 128K
- Широко доступна через Together, Groq, DeepInfra, Fireworks, Azure, CoreWeave и др.
|
~$0.10 вход; ~$0.40 выход (через популярных провайдеров) |
документация |
| Meta-Llama-3.1-70B-Instruct |
Текст (открытые веса) |
до 128,000 |
70 млрд |
Сбалансированная модель 70B семейства 3.1; 66.4% MMLU Pro, ~80.5% HumanEval. Постепенно вытесняется Llama 3.3 70B, но остаётся доступной и используется там, где уже интегрирована. |
- Локальный и облачный вывод моделей
- Модель остаётся доступной и поддерживается в экосистеме
- Для новых проектов обычно рекомендуется Llama 3.3 70B вместо неё
|
бесплатно (открытые веса) или через API-провайдеров |
документация |
| Meta-Llama-3.1-405B-Instruct |
Текст (открытые веса, крупная) |
до 128,000 |
405 млрд |
Крупная универсальная текстовая модель семейства 3.1; ~87.3% MMLU, ~73.4% MMLU Pro, ~89.0% HumanEval. До появления Llama 4 Behemoth рассматривалась как флагманская открытая плотная модель Meta и по-прежнему используется там, где критично качество текста при допустимой стоимости инфраструктуры. |
- Только текст
- Коммерческое использование — по лицензии Meta Llama 3
- Доступ через партнёров (например, Oracle, Azure, IBM) или для локального развёртывания
- Требует значительных ресурсов (сотни ГБ памяти в высокоточных форматах); для экономии обычно используется квантование
|
бесплатно (загрузка весов) |
документация |
| Meta-Llama-3.2-90B-Vision-Instruct |
Текст + изображения (мультимодальная) |
до 128,000 |
90 млрд |
Мультимодальная модель среднего размера; поддерживает восприятие изображений и визуальное рассуждение. Всё ещё активно используется для визуальных задач, хотя часть сценариев переходит на Llama 4 Scout/Maverick. |
- Вход: текст + изображения; выход: текст
- Фокус: распознавание, визуальное рассуждение, работа с документами
- Открытые веса
- Поддерживается сообществом и провайдерами; для новых проектов часто сравнивается с Llama 4 Scout
|
бесплатно (открытые веса) |
документация |
| Meta-Llama-3.2-11B-Vision-Instruct |
Текст + изображения (лёгкая мультимодальная) |
до 128,000 |
11 млрд |
Лёгкая мультимодальная модель для периферии и развёртывания на устройствах; остаётся актуальной для периферийных приложений, где Llama 4 Scout слишком тяжела. |
- Оптимизирована для мобильных и периферийных устройств
- Поддерживает квантование (int4/int8) и выполнение в ограниченных средах
- Открытые веса
|
бесплатно (открытые веса) |
документация |
| Meta-Llama-3.2-3B-Instruct |
Текст (лёгкая) |
до 128,000 |
3 млрд |
Лёгкая текстовая модель для низкой задержки и мобильных приложений; подходит для работы на устройстве и бессерверных сценариев. |
- Поддерживает квантование и работу на устройстве
- Многоязычность поддерживается на уровне Llama 3.x
- Открытые веса
|
бесплатно (открытые веса) |
документация |
| Meta-Llama-3.2-1B-Instruct |
Текст (ультралёгкая) |
до 8,000 |
1 млрд |
Мини-модель для жёстких ограничений по ресурсам; подходит для мобильных и периферийных сценариев, где критичны энергопотребление и размер. |
- Ориентирована на мобильные устройства и микросервисы
- Лицензия Llama 3 Community
- Открытые веса
|
бесплатно (открытые веса) |
документация |
| Llama Guard 4 |
Мультимодальный классификатор безопасности |
~160,000 |
12 млрд |
Модель безопасности для фильтрации вредоносного контента в текстовых и мультимодальных входах/выходах. Релиз 30 апреля 2025 года; используется как основная защита в стеке Llama 4. |
- Мультимодальная (поддерживает анализ текста и изображений)
- Плотная архитектура (производный вариант от Llama 4 Scout)
- Может работать на одном современном GPU; поддерживается крупными провайдерами
- Открытые веса
- Поддерживает множество языков и таксономию категорий MLCommons
- В независимых тестах при связке с Llama 4 блокирует ~66% атакующих запросов; остаточный риск сохраняется, поэтому рекомендуется многоуровневая защита
|
бесплатно (открытые веса; коммерческий API — от ~$0.18/1M токенов у провайдеров) |
документация |