Факты

Название Meta* Llama
Официальный сайт llama.meta.com
Документация llama.meta.com/docs
Чат meta.ai
Страна США
Разработчик Meta Platforms, Inc. (Meta Superintelligence Labs)
Доступы

Ссылки

История релизов

  • 2024-12-06 — Llama 3.3 70B: текстовая модель с производительностью Llama 3.1 405B при меньшей цене и задержке; 86.0% MMLU, 88.4% HumanEval — ссылка
  • 2024-09-25 — Llama 3.2 (Vision 11B/90B и текст 1B/3B) — мультимодальные и лёгкие варианты с 128K контекстом — ссылка
  • 2025-04-05 — Релиз Llama 4 Maverick и Scout: нативно мультимодальные, архитектура MoE, контекст до 1M/10M, лучшие показатели (SOTA) в бенчмарках — ссылка
  • 2025-04-15 — Анонс Llama 4 Behemoth (2T параметров, 288B активных): ещё в бета/ограниченном превью, ожидается полный релиз осенью 2025+ — ссылка
  • 2024-07-23 — Llama 3.1 (405B/70B/8B) с 128K контекстом; передовая текстовая модель (SOTA) — ссылка
  • 2025-Q4 — Llama 4.5 (или Llama 4.X) в разработке; ожидается конец 2025 года под руководством Meta Superintelligence Labs — ссылка

Модели (API и открытые веса)

ID (для API / загрузки) Тип / режим Контекст Параметры (активные/всего) Кратко Поддержка / ограничения Цены ($/1M, Together.ai) Документация
Llama 4 Maverick Мультимодальная (MoE передовая) до 1,000,000 17B активных / 402B всего (128 экспертов) Мощная открытая мультимодальная модель; SOTA на многих бенчмарках; 80.5% MMLU Pro, 69.8% GPQA, ~90% HumanEval.
  • Нативно мультимодальная (текст + изображения → текст)
  • Открытые веса (требуется лицензия Meta Llama 4)
  • Архитектура MoE (памяти ~80-100GB в BF16)
  • Для коммерческого использования: требуется лицензия от Meta для 700М+ MAU
  • Доступна через Together.ai, Groq, Hugging Face и др.
  • Поддержка API дообучения и инференса
вход: $0.27; выход: $0.85 (Together.ai) документация
Llama 4 Scout Мультимодальная (MoE эффективная) до 10,000,000 17B активных / 109B всего (16 экспертов) Эффективная мультимодальная модель для периферии/облака; работает на одном H100; контекст до 10M; баланс качества и скорости.
  • Нативно мультимодальная
  • Открытые веса (лицензия Meta Llama 4)
  • Памяти ~30GB (BF16) / компактнее Maverick за счет 16 экспертов
  • Оптимизирована для скорости и развертывания на периферии (локальная оптимизация)
  • Те же лицензионные ограничения что и Maverick
  • Квантование в int4/int8 возможно для меньшего потребления памяти
вход: $0.18; выход: $0.59 (Together.ai оценка) документация
Llama 4 Behemoth Мультимодальная (MoE ультра) не указано 288B активных / 2,000B всего (16 экспертов) Ультрабольшая модель; SOTA на STEM и рассуждениях; 82.2% MMLU Pro, 73.7% GPQA, 95.0% MATH-500. Ещё не полностью выпущена (ограниченное превью).
  • Нативно мультимодальная
  • Открытые веса (когда будет выпущена)
  • Требует значительные вычислительные ресурсы (тренировка продолжается)
  • Доступна в лимитированном превью для исследования
  • Полный релиз отложен до осени 2025 или позже
не указано (когда выйдет) объявление
Meta-Llama-3.3-70B-Instruct Текст (открытые веса, оптимизированная) до 128,000 (эффективно ~80K) 70B Оптимизированная версия 3.1 70B; производительность 3.1 405B по цене и скорости 70B; 86.0% MMLU, 88.4% HumanEval, 77.0% MATH.
  • Только текстовая модель
  • Открытые веса (лицензия Meta Llama 3)
  • Оптимизирована под онлайн-применение
  • Лучше чем Gemini 1.5 Pro на некоторых бенчмарках
  • Локальный и облачный инференс
  • Тонкая настройка и улучшенное следование инструкциям
~$0.10 вход; ~$0.40 выход (различные провайдеры) документация
Meta-Llama-3.1-405B-Instruct Текст (открытые веса, передовая) до 128,000 405B Крупная универсальная модель семейства 3.1; 87.3% MMLU, 73.3% MMLU Pro, 89.0% HumanEval.
  • Только текст
  • Коммерческое использование — по лицензии Meta Llama
  • Доступ через партнёров (Together, Replicate, Groq и др.)
  • Требует значительные ресурсы (~300GB в FP32)
бесплатно (загрузка весов) или через API-провайдеров документация
Meta-Llama-3.1-70B-Instruct Текст (открытые веса) до 128,000 70B Сбалансированная модель 70B семейства 3.1; 66.4% MMLU Pro, 80.5% HumanEval.
  • Локальный и облачный инференс
  • Популярна среди разработчиков за баланс цена/качество
  • Интеграции через множество платформ
бесплатно (открытые веса) или через API-провайдеров документация
Meta-Llama-3.2-90B-Vision-Instruct Текст+изображения (мультимодальная) до 128,000 90B Мультимодальная модель среднего размера; восприятие изображений и визуальное рассуждение.
  • Вход: текст+картинки; выход: текст
  • Фокус: распознавание и визуальное рассуждение
  • Открытые веса
бесплатно (открытые веса) документация
Meta-Llama-3.2-11B-Vision-Instruct Текст+изображения (лёгкая) до 128,000 11B Лёгкая мультимодальная модель для периферии и развертывания на устройствах.
  • Оптимизирована для мобильных и периферийных устройств
  • Поддержка квантования (int4/int8)
  • Открытые веса
бесплатно (открытые веса) документация
Meta-Llama-3.2-3B-Instruct Текст (лёгкая) до 128,000 3B Лёгкая текстовая модель для низкой задержки и мобильных приложений.
  • Квантование и поддержка работы на устройстве
  • Мультиязычность поддерживается
  • Открытые веса
бесплатно (открытые веса) документация
Meta-Llama-3.2-1B-Instruct Текст (ультралёгкая) до 8,000 1B Мини-модель для крайних ограничений по ресурсам; мобильные и периферийные сценарии.
  • Ориентирована на мобильные устройства
  • Лицензия Meta Llama 3
  • Открытые веса
бесплатно (открытые веса) документация

Ключевые особенности

  • Открытые веса: загрузки на Hugging Face и llama.meta.com/llama-downloads
  • Llama 4 — нативно мультимодальная с архитектурой MoE (Scout и Maverick с апреля 2025)
  • Рекордные контекстные окна: Scout до 10M токенов, Maverick до 1M (апрель 2025); Llama 3.1 до 128K
  • Поддержка локального, периферийного и облачного развёртывания (Llama Everywhere)
  • Llama API (превью) и Llama Stack как продукты экосистемы; также через партнёрские API (Together, Groq, Lambda и др.)
  • Официальные гайды по дообучению, квантованию, интеграциям с вычислительными фреймворками
  • Llama 4.5 (или 4.X) в разработке Meta Superintelligence Labs; ожидается конец 2025 года
  • Meta AI чат (meta.ai) с интеграцией моделей Llama и поиском

Рекомендации по применению

  • Llama 4 Maverick / Scout — универсальные ассистенты, мультимодальные приложения, кодинг, агентные системы (альтернатива закрытым моделям с открытыми весами)
  • Llama 3.3 70B — текстовые задачи, кодинг, многоязычные сценарии (баланс цена/качество vs Llama 3.1 405B)
  • Llama 3.2 Vision (11B/90B) — восприятие изображений, визуальные рассуждения, работа на устройстве/периферии
  • Llama 3.2 (1B/3B) — низкая задержка, мобильные приложения, вычисления на периферии
  • Llama 4 Behemoth (когда будет) — SOTA рассуждения, STEM задачи, конкуренция с GPT-5 / Claude Opus 4.5

Ограничения и риски

  • Лицензионные требования: для MAU > 700 млн требуется отдельное разрешение Meta (может быть отказано)
  • Llama 4 Behemoth — ещё не полностью выпущена (лимитированное превью, отложена до осени 2025+)
  • Длинный контекст (>200K) — Llama 4 показывает деградацию на практических тестах (например, Fiction.LiveBench)
  • Архитектура MoE требует значительную память даже с квантованием
  • Регистрация в ЕС ограничивает коммерческое использование (некоторые версии)
  • Официальное ценообразование API от Meta не опубликовано; доступны через партнёров (Together.ai, Groq и др.)
  • Уязвимости безопасности: оба Llama 4 Scout и Maverick показали средний риск (58 и 52 баллов соответственно) в оценке ProtectAI
  • Часть документации требует авторизации; детали уточняйте в карточках моделей на Hugging Face

Сравнение цен

Чат (подписка)

Meta не предоставляет собственный платный чат-сервис наподобие ChatGPT Plus или Claude Pro. Meta AI (meta.ai) имеет базовый доступ, интегрированный в социальные сервисы Meta; доступ через партнёрские платформы (Together, Groq, Lambda Labs и др.) или локальный инференс.

API (модели через Together.ai и партнёры)

Провайдер Модель / ID вход, $/1M выход, $/1M Ссылка
Meta (Открытые веса) Llama 4 Maverick бесплатно (загрузка) бесплатно (загрузка) huggingface.co
Together.ai Llama 4 Maverick $0.27 $0.85 цены
Together.ai Llama 4 Scout $0.18 $0.59 цены
Together.ai Llama 3.3 70B $0.10 $0.40 цены
Meta (Открытые веса) Llama 3.1 70B / 405B бесплатно (загрузка) бесплатно (загрузка) huggingface.co
CentML Llama 4 Scout (FP8) $0.10 $0.32 цены
OpenAI gpt-5 $1.25 $10.00 цены
Anthropic claude-sonnet-4-5 $3.00 $15.00 цены

Бенчмарки (официальные; апрель 2025)

Модель MMLU Pro (5-shot) GPQA Diamond (0-shot) HumanEval (pass@1) MATH (0-shot) Источник
Llama 4 Maverick 80.5% 69.8% ~90% ~75% официально
Llama 4 Scout 74.3% 57.2% ~85% ~68% официально
Llama 4 Behemoth (превью) 82.2% 73.7% ~88% 95.0% (MATH-500) официально
Llama 3.3 70B 68.9% 50.5% 88.4% 77.0% официально
Llama 3.1 405B 73.3% ~50.7% 89.0% ~85% официально
Llama 3.1 70B 66.4% 41.7% 80.5% ~68% официально
GPT-5 не указано 85.7% 93.4% не указано официально
Claude Sonnet 4.5 не указано не указано ~90% не указано официально
DeepSeek V3 75.9% 59.1% не указано не указано официально

Последние обновления (на декабрь 2025)

  • Llama 4 Scout и Maverick активно используются в производстве; Scout на одном H100, Maverick как основной выбор для приложений требующих лучшее качество.
  • Llama 3.3 70B показывает отличное соотношение цена/качество, вытеснила Llama 3.1 70B в экосистеме; используется в Meta AI чате по умолчанию.
  • Llama 4 Behemoth ещё в лимитированном превью; Meta работает над улучшениями после критики в апреле (длинный контекст, задачи на рассуждение, безопасность).
  • Llama 4.5 / Llama 4.X в разработке под руководством Meta Superintelligence Labs; ожидается выпуск в конце 2025 года.
  • Архитектура MoE становится стандартом для Llama 4.x; требует тщательной оптимизации для развертывания на периферии и требует значительных ресурсов памяти.
  • Лицензионные ограничения (700M MAU) вызывают дискуссию в сообществе; более либеральные чем закрытые модели (OpenAI, Anthropic), но жестче чем «полностью открытые».
  • Llama API расширяется; Meta запустила партнёрства с провайдерами облачных вычислений (Together.ai, Groq, CentML) для оптимального развёртывания.
  • Безопасность Llama 4: ProtectAI выявила средний риск уязвимостей (особенно джейлбрейк и атаки уклонения); Llama Guard 4 как дополнительная система защиты.