Gemma 3n E2B

Gemma — семейство открытых легковесных языковых моделей, разработанное Google DeepMind, основанное на той же исследовательской базе и технологиях, что и Gemini. Платформа предоставляет полностью открытые веса моделей для свободного использования, доработки и развёртывания на потребительском оборудовании (ноутбуках, настольных компьютерах, мобильных устройствах) без необходимости облачных сервисов. Gemma позиционируется как альтернатива закрытым моделям, позволяя разработчикам и исследователям создавать AI-приложения с полной кастомизацией и сохранением данных локально.

Семейство включает три поколения моделей: Gemma 1 (2B, 7B параметров), Gemma 2 (2B, 9B, 27B), Gemma 3 (1B, 4B, 12B, 27B) с поддержкой текста и мультимодальности. Модели выделяются поддержкой 140+ языков, расширенным контекстным окном (128K токенов), мультимодальными способностями (текст+изображения), методом дистилляции для оптимизации, поддержкой тренировки с подкреплением (RLHF, RLMF, RLEF), функциями вызова функций для агентных применений, интеграцией с популярными фреймворками (JAX, PyTorch, TensorFlow, Ollama, Hugging Face) и коммерческого лицензирования.

Особенности:

  • Открытые веса: полностью свободный доступ к весам моделей для локального и коммерческого использования под Apache 2.0 лицензией.
  • Семейство размеров: модели от 1B до 27B параметров для баланса производительности и эффективности.
  • Мультимодальность (Gemma 3): анализ текста и изображений совместно с встроенной поддержкой видео.
  • Расширенный контекст (128K токенов): анализ длинных документов без потери контекста.
  • Многоязычность: поддержка 140+ языков для глобального развёртывания.
  • Дистилляция знаний: технология переноса знаний из больших моделей в компактные для повышения эффективности.
  • Обучение с подкреплением: RLHF для безопасности, RLMF для математики, RLEF для логики и кода.
  • Function Calling: поддержка вызова функций для создания AI-агентов с инструментами.
  • CodeGemma: специализированная версия для задач программирования.
  • PaliGemma 2: видение-языковые модели для обработки визуальных данных.
  • Локальное развёртывание: работа на CPU, GPU, TPU без облачных зависимостей.
  • Фреймворки: интеграция с JAX, PyTorch, TensorFlow, Ollama, Hugging Face, Google AI Studio.

Ссылки:

Новости

Gemma 3n и MatFormer

Gemma 3n и MatFormer: как одна модель превращается в целое семейство эффективных решений

Google Gemma 3n с архитектурой MatFormer позволяет из одной большой модели получать семейство меньших высокопроизводительных вариантов без потери качества.