Kimi

Kimi — интеллектуальный ассистент от Moonshot AI с поддержкой линейки моделей K2 (Mixture-of-Experts, 1 триллион параметров). Платформа предлагает сверхдлинный контекст (до 256 тыс. токенов), онлайн-поиск, работу с файлами и OpenAI/Anthropic-совместимые API для бесшовной интеграции.

K2 создан как агентная модель — автономно планирует и выполняет многошаговые задачи, от анализа данных до вызова инструментов. Весовые коэффициенты доступны под модифицированной MIT-лицензией. Цена — $0,15–0,60 за 1 млн входных токенов, в 10–100 раз дешевле GPT-4 и Claude Opus.

Особенности:

  • Сверхдлинный контекст (128K–256K токенов) и онлайн-поиск.
  • Агентный интеллект: автономное использование инструментов, выполнение кода, многошаговые рабочие процессы.
  • OpenAI/Anthropic-совместимый API (эндпоинт api.moonshot.ai/v1).
  • Open-weight релизы K2-Base и K2-Instruct для кастомизации и агентных сценариев.
  • Бесплатный чат-интерфейс и доступ через OpenRouter.
  • Мобильные приложения (Android/iOS) и расширения Chrome.
  • Context Caching: до 90% экономии токенов и снижение задержки на 83% при повторных запросах.
  • Кроссплатформенная поддержка: vLLM, SGLang, KTransformers, TensorRT-LLM.

Ссылки:

Новости

Kimi K2.7 Code

Открытая модель Kimi K2.7 Code обходит лидеров рынка и доступна за меньшую цену

Moonshot AI выпустила Kimi K2.7 Code — открытую модель с 1 трлн параметров, которая радикально снижает стоимость генерации кода по сравнению с GPT-5.5 и Claude.

Nvidia Nemotron 3 Ultra

Nvidia Nemotron 3 Ultra стала лидером среди open-source моделей из США, но уступает китайской Kimi

Компания Nvidia анонсировала Nemotron 3 Ultra — самую мощную открытую нейросеть в США, которая показывает рекордную скорость работы, но пока не может обойти китайских конкурентов.

Xiaohongshu исследование агентов

Поисковые ИИ-агенты предпочитают подтверждать свои догадки, а не исследовать сеть

Новое исследование доказывает, что ИИ-агенты часто используют веб-поиск лишь для подтверждения собственных догадок, игнорируя реальные факты из сети.

Cursor Composer 2.5

Cursor представил модель Composer 2.5: выше производительность кодинга и ниже затраты

Разработчики ИИ-редактора кода Cursor выпустили Composer 2.5, масштабное обновление своей внутренней модели. Новая версия демонстрирует результаты на уровне Claude 4.7 Opus и GPT-5.5, но при этом обходится пользователям в разы дешевле.

AMD выпускает плагин vLLM-ATOM

AMD выпускает плагин vLLM-ATOM для ускорения DeepSeek-R1 и Kimi-K2 на ускорителях Instinct

AMD выпускает плагин vLLM-ATOM, который значительно ускоряет работу моделей DeepSeek-R1 и Kimi-K2 на ускорителях Instinct MI350 и MI400 через глубокую оптимизацию ядер.

Moonshot AI представила Kimi K2.6

Moonshot AI представила Kimi K2.6: открытая модель с поддержкой сотен параллельных агентов

Moonshot AI представила Kimi K2.6 — мощную открытую модель, оптимизированную для программирования и управления сложными системами из сотен параллельных агентов.