Gemma 3n E2B

Gemma — семейство открытых легковесных языковых моделей, разработанное Google DeepMind, основанное на той же исследовательской базе и технологиях, что и Gemini. Платформа предоставляет полностью открытые веса моделей для свободного использования, доработки и развёртывания на потребительском оборудовании (ноутбуках, настольных компьютерах, мобильных устройствах) без необходимости облачных сервисов. Gemma позиционируется как альтернатива закрытым моделям, позволяя разработчикам и исследователям создавать AI-приложения с полной кастомизацией и сохранением данных локально.

Семейство включает три поколения моделей: Gemma 1 (2B, 7B параметров), Gemma 2 (2B, 9B, 27B), Gemma 3 (1B, 4B, 12B, 27B) с поддержкой текста и мультимодальности. Модели выделяются поддержкой 140+ языков, расширенным контекстным окном (128K токенов), мультимодальными способностями (текст+изображения), методом дистилляции для оптимизации, поддержкой тренировки с подкреплением (RLHF, RLMF, RLEF), функциями вызова функций для агентных применений, интеграцией с популярными фреймворками (JAX, PyTorch, TensorFlow, Ollama, Hugging Face) и коммерческого лицензирования.

Особенности:

Открытые веса: полностью свободный доступ к весам моделей для локального и коммерческого использования под Apache 2.0 лицензией.
Семейство размеров: модели от 1B до 27B параметров для баланса производительности и эффективности.
Мультимодальность (Gemma 3): анализ текста и изображений совместно с встроенной поддержкой видео.
Расширенный контекст (128K токенов): анализ длинных документов без потери контекста.
Многоязычность: поддержка 140+ языков для глобального развёртывания.
Дистилляция знаний: технология переноса знаний из больших моделей в компактные для повышения эффективности.
Обучение с подкреплением: RLHF для безопасности, RLMF для математики, RLEF для логики и кода.
Function Calling: поддержка вызова функций для создания AI-агентов с инструментами.
CodeGemma: специализированная версия для задач программирования.
PaliGemma 2: видение-языковые модели для обработки визуальных данных.
Локальное развёртывание: работа на CPU, GPU, TPU без облачных зависимостей.
Фреймворки: интеграция с JAX, PyTorch, TensorFlow, Ollama, Hugging Face, Google AI Studio.

Ссылки:

Новости

Gemma 3n и MatFormer: как одна модель превращается в целое семейство эффективных решений

Google Gemma 3n с архитектурой MatFormer позволяет из одной большой модели получать семейство меньших высокопроизводительных вариантов без потери качества.