Факты
| Название | Meta* Llama |
| Официальный сайт | llama.meta.com |
| Документация | llama.meta.com/docs |
| Чат | meta.ai |
| Страна | США |
| Разработчик | Meta Platforms, Inc. (Meta Superintelligence Labs) |
| Доступы |
|
Ссылки
- Документация
- Загрузки / Llama API / Llama Stack
- Hugging Face (все модели)
- Карточка модели: Llama 3.1
- Карточка модели: Llama 3.2 (Зрение/Текст)
- Дообучение
- Квантование
- Ответственное использование / Политики
- Блог: семейство Llama 4
- Meta AI (чат)
История релизов
- 2024-12-06 — Llama 3.3 70B: текстовая модель с производительностью Llama 3.1 405B при меньшей цене и задержке; 86.0% MMLU, 88.4% HumanEval — ссылка
- 2024-09-25 — Llama 3.2 (Vision 11B/90B и текст 1B/3B) — мультимодальные и лёгкие варианты с 128K контекстом — ссылка
- 2025-04-05 — Релиз Llama 4 Maverick и Scout: нативно мультимодальные, архитектура MoE, контекст до 1M/10M, лучшие показатели (SOTA) в бенчмарках — ссылка
- 2025-04-15 — Анонс Llama 4 Behemoth (2T параметров, 288B активных): ещё в бета/ограниченном превью, ожидается полный релиз осенью 2025+ — ссылка
- 2024-07-23 — Llama 3.1 (405B/70B/8B) с 128K контекстом; передовая текстовая модель (SOTA) — ссылка
- 2025-Q4 — Llama 4.5 (или Llama 4.X) в разработке; ожидается конец 2025 года под руководством Meta Superintelligence Labs — ссылка
Модели (API и открытые веса)
| ID (для API / загрузки) | Тип / режим | Контекст | Параметры (активные/всего) | Кратко | Поддержка / ограничения | Цены ($/1M, Together.ai) | Документация |
|---|---|---|---|---|---|---|---|
| Llama 4 Maverick | Мультимодальная (MoE передовая) | до 1,000,000 | 17B активных / 402B всего (128 экспертов) | Мощная открытая мультимодальная модель; SOTA на многих бенчмарках; 80.5% MMLU Pro, 69.8% GPQA, ~90% HumanEval. |
|
вход: $0.27; выход: $0.85 (Together.ai) | документация |
| Llama 4 Scout | Мультимодальная (MoE эффективная) | до 10,000,000 | 17B активных / 109B всего (16 экспертов) | Эффективная мультимодальная модель для периферии/облака; работает на одном H100; контекст до 10M; баланс качества и скорости. |
|
вход: $0.18; выход: $0.59 (Together.ai оценка) | документация |
| Llama 4 Behemoth | Мультимодальная (MoE ультра) | не указано | 288B активных / 2,000B всего (16 экспертов) | Ультрабольшая модель; SOTA на STEM и рассуждениях; 82.2% MMLU Pro, 73.7% GPQA, 95.0% MATH-500. Ещё не полностью выпущена (ограниченное превью). |
|
не указано (когда выйдет) | объявление |
| Meta-Llama-3.3-70B-Instruct | Текст (открытые веса, оптимизированная) | до 128,000 (эффективно ~80K) | 70B | Оптимизированная версия 3.1 70B; производительность 3.1 405B по цене и скорости 70B; 86.0% MMLU, 88.4% HumanEval, 77.0% MATH. |
|
~$0.10 вход; ~$0.40 выход (различные провайдеры) | документация |
| Meta-Llama-3.1-405B-Instruct | Текст (открытые веса, передовая) | до 128,000 | 405B | Крупная универсальная модель семейства 3.1; 87.3% MMLU, 73.3% MMLU Pro, 89.0% HumanEval. |
|
бесплатно (загрузка весов) или через API-провайдеров | документация |
| Meta-Llama-3.1-70B-Instruct | Текст (открытые веса) | до 128,000 | 70B | Сбалансированная модель 70B семейства 3.1; 66.4% MMLU Pro, 80.5% HumanEval. |
|
бесплатно (открытые веса) или через API-провайдеров | документация |
| Meta-Llama-3.2-90B-Vision-Instruct | Текст+изображения (мультимодальная) | до 128,000 | 90B | Мультимодальная модель среднего размера; восприятие изображений и визуальное рассуждение. |
|
бесплатно (открытые веса) | документация |
| Meta-Llama-3.2-11B-Vision-Instruct | Текст+изображения (лёгкая) | до 128,000 | 11B | Лёгкая мультимодальная модель для периферии и развертывания на устройствах. |
|
бесплатно (открытые веса) | документация |
| Meta-Llama-3.2-3B-Instruct | Текст (лёгкая) | до 128,000 | 3B | Лёгкая текстовая модель для низкой задержки и мобильных приложений. |
|
бесплатно (открытые веса) | документация |
| Meta-Llama-3.2-1B-Instruct | Текст (ультралёгкая) | до 8,000 | 1B | Мини-модель для крайних ограничений по ресурсам; мобильные и периферийные сценарии. |
|
бесплатно (открытые веса) | документация |
Ключевые особенности
- Открытые веса: загрузки на Hugging Face и llama.meta.com/llama-downloads
- Llama 4 — нативно мультимодальная с архитектурой MoE (Scout и Maverick с апреля 2025)
- Рекордные контекстные окна: Scout до 10M токенов, Maverick до 1M (апрель 2025); Llama 3.1 до 128K
- Поддержка локального, периферийного и облачного развёртывания (Llama Everywhere)
- Llama API (превью) и Llama Stack как продукты экосистемы; также через партнёрские API (Together, Groq, Lambda и др.)
- Официальные гайды по дообучению, квантованию, интеграциям с вычислительными фреймворками
- Llama 4.5 (или 4.X) в разработке Meta Superintelligence Labs; ожидается конец 2025 года
- Meta AI чат (meta.ai) с интеграцией моделей Llama и поиском
Рекомендации по применению
- Llama 4 Maverick / Scout — универсальные ассистенты, мультимодальные приложения, кодинг, агентные системы (альтернатива закрытым моделям с открытыми весами)
- Llama 3.3 70B — текстовые задачи, кодинг, многоязычные сценарии (баланс цена/качество vs Llama 3.1 405B)
- Llama 3.2 Vision (11B/90B) — восприятие изображений, визуальные рассуждения, работа на устройстве/периферии
- Llama 3.2 (1B/3B) — низкая задержка, мобильные приложения, вычисления на периферии
- Llama 4 Behemoth (когда будет) — SOTA рассуждения, STEM задачи, конкуренция с GPT-5 / Claude Opus 4.5
Ограничения и риски
- Лицензионные требования: для MAU > 700 млн требуется отдельное разрешение Meta (может быть отказано)
- Llama 4 Behemoth — ещё не полностью выпущена (лимитированное превью, отложена до осени 2025+)
- Длинный контекст (>200K) — Llama 4 показывает деградацию на практических тестах (например, Fiction.LiveBench)
- Архитектура MoE требует значительную память даже с квантованием
- Регистрация в ЕС ограничивает коммерческое использование (некоторые версии)
- Официальное ценообразование API от Meta не опубликовано; доступны через партнёров (Together.ai, Groq и др.)
- Уязвимости безопасности: оба Llama 4 Scout и Maverick показали средний риск (58 и 52 баллов соответственно) в оценке ProtectAI
- Часть документации требует авторизации; детали уточняйте в карточках моделей на Hugging Face
Сравнение цен
Чат (подписка)
Meta не предоставляет собственный платный чат-сервис наподобие ChatGPT Plus или Claude Pro. Meta AI (meta.ai) имеет базовый доступ, интегрированный в социальные сервисы Meta; доступ через партнёрские платформы (Together, Groq, Lambda Labs и др.) или локальный инференс.
API (модели через Together.ai и партнёры)
| Провайдер | Модель / ID | вход, $/1M | выход, $/1M | Ссылка |
|---|---|---|---|---|
| Meta (Открытые веса) | Llama 4 Maverick | бесплатно (загрузка) | бесплатно (загрузка) | huggingface.co |
| Together.ai | Llama 4 Maverick | $0.27 | $0.85 | цены |
| Together.ai | Llama 4 Scout | $0.18 | $0.59 | цены |
| Together.ai | Llama 3.3 70B | $0.10 | $0.40 | цены |
| Meta (Открытые веса) | Llama 3.1 70B / 405B | бесплатно (загрузка) | бесплатно (загрузка) | huggingface.co |
| CentML | Llama 4 Scout (FP8) | $0.10 | $0.32 | цены |
| OpenAI | gpt-5 | $1.25 | $10.00 | цены |
| Anthropic | claude-sonnet-4-5 | $3.00 | $15.00 | цены |
Бенчмарки (официальные; апрель 2025)
| Модель | MMLU Pro (5-shot) | GPQA Diamond (0-shot) | HumanEval (pass@1) | MATH (0-shot) | Источник |
|---|---|---|---|---|---|
| Llama 4 Maverick | 80.5% | 69.8% | ~90% | ~75% | официально |
| Llama 4 Scout | 74.3% | 57.2% | ~85% | ~68% | официально |
| Llama 4 Behemoth (превью) | 82.2% | 73.7% | ~88% | 95.0% (MATH-500) | официально |
| Llama 3.3 70B | 68.9% | 50.5% | 88.4% | 77.0% | официально |
| Llama 3.1 405B | 73.3% | ~50.7% | 89.0% | ~85% | официально |
| Llama 3.1 70B | 66.4% | 41.7% | 80.5% | ~68% | официально |
| GPT-5 | не указано | 85.7% | 93.4% | не указано | официально |
| Claude Sonnet 4.5 | не указано | не указано | ~90% | не указано | официально |
| DeepSeek V3 | 75.9% | 59.1% | не указано | не указано | официально |
Последние обновления (на декабрь 2025)
- Llama 4 Scout и Maverick активно используются в производстве; Scout на одном H100, Maverick как основной выбор для приложений требующих лучшее качество.
- Llama 3.3 70B показывает отличное соотношение цена/качество, вытеснила Llama 3.1 70B в экосистеме; используется в Meta AI чате по умолчанию.
- Llama 4 Behemoth ещё в лимитированном превью; Meta работает над улучшениями после критики в апреле (длинный контекст, задачи на рассуждение, безопасность).
- Llama 4.5 / Llama 4.X в разработке под руководством Meta Superintelligence Labs; ожидается выпуск в конце 2025 года.
- Архитектура MoE становится стандартом для Llama 4.x; требует тщательной оптимизации для развертывания на периферии и требует значительных ресурсов памяти.
- Лицензионные ограничения (700M MAU) вызывают дискуссию в сообществе; более либеральные чем закрытые модели (OpenAI, Anthropic), но жестче чем «полностью открытые».
- Llama API расширяется; Meta запустила партнёрства с провайдерами облачных вычислений (Together.ai, Groq, CentML) для оптимального развёртывания.
- Безопасность Llama 4: ProtectAI выявила средний риск уязвимостей (особенно джейлбрейк и атаки уклонения); Llama Guard 4 как дополнительная система защиты.