Kimi

Kimi — интеллектуальный ассистент от Moonshot AI с поддержкой линейки моделей K2 (Mixture-of-Experts, 1 триллион параметров). Платформа предлагает сверхдлинный контекст (до 256 тыс. токенов), онлайн-поиск, работу с файлами и OpenAI/Anthropic-совместимые API для бесшовной интеграции.

K2 создан как агентная модель — автономно планирует и выполняет многошаговые задачи, от анализа данных до вызова инструментов. Весовые коэффициенты доступны под модифицированной MIT-лицензией. Цена — $0,15–0,60 за 1 млн входных токенов, в 10–100 раз дешевле GPT-4 и Claude Opus.

Особенности:

Сверхдлинный контекст (128K–256K токенов) и онлайн-поиск.
Агентный интеллект: автономное использование инструментов, выполнение кода, многошаговые рабочие процессы.
OpenAI/Anthropic-совместимый API (эндпоинт api.moonshot.ai/v1).
Open-weight релизы K2-Base и K2-Instruct для кастомизации и агентных сценариев.
Бесплатный чат-интерфейс и доступ через OpenRouter.
Мобильные приложения (Android/iOS) и расширения Chrome.
Context Caching: до 90% экономии токенов и снижение задержки на 83% при повторных запросах.
Кроссплатформенная поддержка: vLLM, SGLang, KTransformers, TensorRT-LLM.

Ссылки:

Новости

Kimi

Новости

Открытая модель Kimi K2.7 Code обходит лидеров рынка и доступна за меньшую цену

Nvidia Nemotron 3 Ultra стала лидером среди open-source моделей из США, но уступает китайской Kimi

Поисковые ИИ-агенты предпочитают подтверждать свои догадки, а не исследовать сеть

Cursor представил модель Composer 2.5: выше производительность кодинга и ниже затраты

AMD выпускает плагин vLLM-ATOM для ускорения DeepSeek-R1 и Kimi-K2 на ускорителях Instinct

Moonshot AI представила Kimi K2.6: открытая модель с поддержкой сотен параллельных агентов