Пока индустрия соревнуется в количестве нулей в параметрах флагманских моделей, бывшие ученые из MIT предложили альтернативный путь развития. Компания Liquid AI представила LFM2.5-230M — свою самую миниатюрную языковую модель, которая при весе всего в 230 миллионов параметров умудряется обходить решения, превосходящие её по объему в четыре раза. Как сообщает VentureBeat, новинка ориентирована на локальное использование в смартфонах, ноутбуках и робототехнике.
Этот релиз выглядит как осознанный вызов доминирующему нарративу о том, что «больше — значит лучше». Модель LFM2.5-230M спроектирована специально для автономных агентских рабочих процессов на периферийных устройствах. Согласно данным разработчиков, она показывает лучшие результаты в задачах извлечения данных, чем 800-миллионная Alibaba Qwen3.5-0.8B и даже миллиардная Google Gemma 3 1B, что заставляет в очередной раз задуматься об эффективности классических трансформеров.
В основе архитектуры лежит фреймворк LFM2, который отходит от стандартных механизмов внимания в пользу гибридной системы. Здесь используются шлюзованные свертки ближнего действия в сочетании с механизмом Grouped-query Attention. Это позволяет обрабатывать последовательности данных без квадратичного роста затрат памяти, который так часто становится камнем преткновения для разработчиков, пытающихся запустить ИИ на слабом железе.
Для корпоративного сектора появление такой модели — это прежде всего вопрос экономики и надежности. Традиционные ETL-скрипты, используемые для обработки данных, крайне хрупки и ломаются при малейшем изменении структуры документа. Переход к «AI ETL», где модель сама понимает схему данных, часто упирается в стоимость API. Использование тяжелых моделей вроде Claude 4.6 для парсинга инвойсов экономически неоправданно, тогда как LFM2.5-230M позволяет делать это локально и практически бесплатно.
Эпоха гигантомании сменяется эрой хирургической точности: модель на 230 млн параметров, обученная на 19 трлн токенов, закрывает вопрос базовой автоматизации лучше, чем неповоротливые флагманы. Однако архитектурное изящество не заменяет когнитивную глубину — для сложной логики всё равно придется «идти в облако». Liquid AI создали идеальный «мозг» для микроволновки, который по ошибке могут принять за замену полноценному интеллекту.
Технические характеристики модели впечатляют при её габаритах: она поддерживает контекстное окно в 32K токенов, потребляя при этом менее 400 МБ оперативной памяти. На смартфоне Samsung Galaxy S25 Ultra с процессором Snapdragon Gen4 скорость генерации достигает 213 токенов в секунду. Даже скромный Raspberry Pi 5 выдает вполне рабочие 42 токена в секунду, что открывает двери для создания по-настоящему умных IoT-устройств.
Практическое применение архитектуры уже продемонстрировали на примере гуманоидного робота Unitree G1. Модель, работающая на модуле NVIDIA Jetson Orin, способна трансформировать естественные инструкции в последовательность команд для низкоуровневых навыков робота. Это превращает LFM2.5-230M в эффективный слой выбора навыков, который не требует постоянного интернет-соединения для выполнения сложных физических манипуляций.
Что касается доступности, Liquid AI выбрала гибридный путь лицензирования. Модель распространяется под LFM Open License v1.0. Она бесплатна для индивидуальных разработчиков и компаний с годовым доходом менее 10 миллионов долларов. Для крупных корпораций предусмотрено платное соглашение. Такой подход выглядит как попытка защитить интеллектуальную собственность от поглощения технологическими гигантами, сохранив при этом лояльность сообщества.
Модель уже доступна на Hugging Face с поддержкой популярных инструментов инференса, включая llama.cpp, vLLM и ONNX. Хотя разработчики честно признают, что их детище не предназначено для решения математических задач или написания кода, в своей нише — структурировании данных и вызове инструментов — оно устанавливает новую планку эффективности для мобильных систем.
Оставить комментарий