Китайский стартап Moonshot AI выпустил новую версию своей языковой модели Kimi K2.6, которая теперь доступна в формате open-weight. Как сообщает The Decoder, разработка призвана составить прямую конкуренцию лидерам рынка в лице GPT-5.4 и Claude Opus 4.6, делая ставку на впечатляющие возможности автономного выполнения кода и многоагентные системы.
Архитектура модели оптимизирована для решения сложных инженерных задач. Согласно внутренним тестам, Kimi K2.6 демонстрирует высокие результаты на бенчмарках SWE-Bench Pro (58.6) и HLE с использованием инструментов (54.0). Модель способна поддерживать непрерывный цикл работы более двенадцати часов, оперируя такими языками программирования, как Python, Rust и Go, и совершая при этом более 4 000 вызовов различных инструментов (tool calls) в рамках одной сессии.
Роевой интеллект и параллельная работа агентов
Ключевой особенностью релиза стала технология Agent Swarm (рой агентов), позволяющая запускать до 300 специализированных суб-агентов одновременно. Система автоматически декомпозирует сложную задачу на мелкие подзадачи, распределяя их между виртуальными сотрудниками. Каждый такой агент может выполнять до 4 000 последовательных шагов, комбинируя поиск в сети, глубокий анализ документации и написание текстов для формирования финального продукта.
Для более тонкой настройки взаимодействия предусмотрена функция claw groups, которая организует совместную работу ИИ и человека. В этой связке Kimi K2.6 берет на себя роль координатора: распределяет обязанности на основе сильных сторон каждого участника и вмешивается в процесс, если один из агентов заходит в тупик или допускает критическую ошибку. Подобная структура напоминает работу проектного офиса, где ИИ выступает в роли неутомимого тимлида.
Практическое применение модели охватывает полный цикл веб-разработки. На основе текстовых промптов K2.6 создает полноценные сайты с анимацией и подключенными базами данных. Примечательно, что модель не ограничивается фронтендом, а берется за полноценный full-stack: от настройки авторизации пользователей до управления сессиями. Интеграция с генераторами изображений и видео позволяет поддерживать визуальное единство создаваемого контента без ручного вмешательства дизайнера.
Демонстрация сотен агентов в параллели впечатляет как инженерное достижение, однако за этим количественным показателем часто скрывается проблема избыточного потребления токенов при минимальном приросте качества. Способность модели координировать ‘рой’ не отменяет галлюцинаций на длинных дистанциях в 12 часов. Это мощный инструмент для прототипирования, но пока лишь заявка на лидерство, требующая проверки в условиях реального продакшена.
Условия использования и доступность
Moonshot AI выбрала достаточно гибкую стратегию распространения, опубликовав веса модели под модифицированной лицензией MIT. Основное ограничение касается лишь крупных коммерческих игроков: если ежемесячная аудитория продукта превышает 100 миллионов пользователей или выручка составляет более 20 миллионов долларов в месяц, компания обязана разместить упоминание Kimi K2.6 в интерфейсе своего приложения.
Для профессионального сообщества и разработчиков предусмотрено несколько способов взаимодействия с новой моделью. Опробовать возможности Kimi K2.6 можно следующими способами:
- Веб-интерфейс в режимах чата и работы с агентами на официальном сайте.
- Специализированная среда разработки Kimi Code для написания и отладки программного обеспечения.
- Программный доступ через API для интеграции в сторонние сервисы.
- Загрузка весов модели с платформы Hugging Face для локального развертывания.
Несмотря на амбициозные заявления в области программирования и агентских сценариев, стоит заметить, что в тестах на чистое логическое рассуждение и обработку визуальных данных модель все еще несколько уступает актуальным флагманам от OpenAI и Google. Тем не менее, открытый доступ к столь мощному инструменту для работы с кодом может существенно изменить ландшафт разработки ИИ-сервисов в ближайшее время.
Оставить комментарий