Оглавление
Стартапы создают специализированные энергоэффективные модели, чтобы сократить издержки и конкурировать с крупномасштабными системами.
Смена парадигмы в разработке ИИ
Парадигма соревнования ИИ-моделей, которая в последние годы сводилась к наращиванию размеров, меняется. Технологические гиганты вроде OpenAI и Google разрабатывали модели с сотнями миллиардов, а иногда и триллионами параметров — единиц, которые соединяют ИИ во время обучения и вывода. Чем больше параметров, тем умнее модель. Однако разработка массивных ИИ-моделей требует колоссальных затрат и все чаще упирается в пределы эффективности.
В ответ на это стартапы начали полномасштабную конкуренцию по созданию легковесных ИИ-моделей — компактных, но мощных. Обычно модели с 100 миллиардами параметров или меньше классифицируются как легковесные.
Снижение затрат и специализация в конкретных областях
Обучение ИИ на огромных объемах данных влечет за собой огромные расходы. На заре развития ИИ крупные технологические компании соревновались в создании гигантских моделей, несмотря на затраты. GPT от OpenAI и Gemini от Google — яркие примеры таких крупномасштабных моделей, служащих универсальными продуктами, применимыми во всех областях. Однако известно, что эти массивные модели потребляют значительное количество энергии и требуют высоких эксплуатационных расходов.
Чтобы выжить в конкуренции с гигантами, стартапы обратились к легковесным ИИ-моделям. Хотя эти модели могут не преуспевать во всех областях, они превосходят других в конкретных сферах. Например, ИИ-модели, специализированные на праве или медицине. Легковесные модели также энергоэффективны, что делает их пригодными для ИИ на устройствах. Они работают внутри устройств без необходимости подключения к облаку (виртуальному серверу), предлагая дополнительное преимущество.
Французский стартап Mistral AI — лидер в области легковесных ИИ-моделей. Компания последовательно выпускала модели вроде «Mistral Small 3.1» и «Mixtral 1.2». Модель Mistral Small 3.1 с примерно 20 миллиардами параметров демонстрирует высокую производительность и может работать на компьютерах Apple Mac без зависимости от облака. Канадский стартап Cohere, как сообщается, достигает производительности, превосходящей модель GPT-4 от OpenAI, используя всего два GPU (графических процессора). Это снижает потребность в крупномасштабных дата-центрах, обеспечивая преимущества в стоимости.
Пока гиганты соревнуются в размерах моделей, стартапы доказывают, что эффективность часто важнее масштаба. Легковесные модели — это не компромисс, а стратегический выбор: они позволяют работать на устройствах конечных пользователей, сокращают зависимость от облачной инфраструктуры и открывают путь к реальной монетизации ИИ. В мире, где энергопотребление становится критическим фактором, быть маленьким — значит быть умным.
Глобальные игроки и локальные стратегии
Китай, конкурирующий с США в области ИИ, наверстывает упущенное с помощью легковесных моделей. Из-за санкций США, ограничивающих доступ к GPU, необходимым для обучения и работы ИИ, разработка легковесных моделей стала критической задачей для Китая. Им нужен ИИ, который хорошо работает с меньшим количеством GPU. DeepSeek — представительная китайская компания, разрабатывающая легковесные ИИ-модели. Alibaba представила «Tongyi DeepResearch» — ИИ-агента (помощника) для конкуренции с OpenAI, утверждая, что его 30 миллиардов параметров соответствуют производительности OpenAI.
Крупные технологические гиганты также реагируют на вызовы. Google DeepMind выпустила сверхлегковесную ИИ-модель с 270 миллионами параметров, оптимизированную для мобильных устройств. «gpt-oss-120B» и «gpt-oss-20B» от OpenAI также являются легковесными моделями. Исследовательская организация Samsung Electronics, SAIT Canada Montreal Research Institute, представила сверхкомпактную модель вывода ИИ с 7 миллионами параметров.
Как отмечает представитель технологической индустрии: «Для убыточных ИИ-компаний, чтобы в конечном итоге выйти на прибыль, ключевыми являются снижение затрат и повышение эффективности. Именно поэтому они выпускают легковесные ИИ-модели, которые преуспевают в конкретных задачах, а не универсальные продукты».
По сообщению The Chosun Ilbo, переход к легковесным моделям становится трендом, который может переопределить конкурентный ландшафт в индустрии искусственного интеллекта.
Оставить комментарий