Gemma 3n и MatFormer: как одна модель превращается в целое семейство эффективных решений
Google Gemma 3n с архитектурой MatFormer позволяет из одной большой модели получать семейство меньших высокопроизводительных вариантов без потери качества.
Gemma — семейство открытых легковесных языковых моделей, разработанное Google DeepMind, основанное на той же исследовательской базе и технологиях, что и Gemini. Платформа предоставляет полностью открытые веса моделей для свободного использования, доработки и развёртывания на потребительском оборудовании (ноутбуках, настольных компьютерах, мобильных устройствах) без необходимости облачных сервисов. Gemma позиционируется как альтернатива закрытым моделям, позволяя разработчикам и исследователям создавать AI-приложения с полной кастомизацией и сохранением данных локально.
Семейство включает три поколения моделей: Gemma 1 (2B, 7B параметров), Gemma 2 (2B, 9B, 27B), Gemma 3 (1B, 4B, 12B, 27B) с поддержкой текста и мультимодальности. Модели выделяются поддержкой 140+ языков, расширенным контекстным окном (128K токенов), мультимодальными способностями (текст+изображения), методом дистилляции для оптимизации, поддержкой тренировки с подкреплением (RLHF, RLMF, RLEF), функциями вызова функций для агентных применений, интеграцией с популярными фреймворками (JAX, PyTorch, TensorFlow, Ollama, Hugging Face) и коммерческого лицензирования.
Особенности:
Ссылки:
Google Gemma 3n с архитектурой MatFormer позволяет из одной большой модели получать семейство меньших высокопроизводительных вариантов без потери качества.