Kimi

Kimi — интеллектуальный ассистент от Moonshot AI с поддержкой линейки моделей K2 (Mixture-of-Experts, 1 триллион параметров). Платформа предлагает сверхдлинный контекст (до 256 тыс. токенов), онлайн-поиск, работу с файлами и OpenAI/Anthropic-совместимые API для бесшовной интеграции.

K2 создан как агентная модель — автономно планирует и выполняет многошаговые задачи, от анализа данных до вызова инструментов. Весовые коэффициенты доступны под модифицированной MIT-лицензией. Цена — $0,15–0,60 за 1 млн входных токенов, в 10–100 раз дешевле GPT-4 и Claude Opus.

Особенности:

  • Сверхдлинный контекст (128K–256K токенов) и онлайн-поиск.
  • Агентный интеллект: автономное использование инструментов, выполнение кода, многошаговые рабочие процессы.
  • OpenAI/Anthropic-совместимый API (эндпоинт api.moonshot.ai/v1).
  • Open-weight релизы K2-Base и K2-Instruct для кастомизации и агентных сценариев.
  • Бесплатный чат-интерфейс и доступ через OpenRouter.
  • Мобильные приложения (Android/iOS) и расширения Chrome.
  • Context Caching: до 90% экономии токенов и снижение задержки на 83% при повторных запросах.
  • Кроссплатформенная поддержка: vLLM, SGLang, KTransformers, TensorRT-LLM.

Ссылки:

Новости

Mistral выпустила Devstral 2

Mistral выпустила Devstral 2 — мощную модель для программистов с ограниченной лицензией

Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.

Kimi обгоняет GPT-5 и Claude

Китайская модель Kimi K2 Thinking превзошла GPT-5 и Claude 4.5 в ключевых тестах

Китайская модель Kimi K2 Thinking от Moonshot AI превзошла GPT-5 и Claude 4.5 в ключевых тестах на рассуждения и программирование при конкурентной цене.

Какие ИИ-модели чаще всего поддерживают бредовые идеи пользователей?

Новый тест Spiral-Bench выявил радикальные различия в безопасности языковых моделей: от осторожного GPT-5 до рискованного Deepseek.

Практическое руководство по отладке MoE-моделей: от мифов к рабочей реализации

Практическое руководство по созданию и отладке MoE-моделей на обычном железе с реальными примерами кода и анализом常见 проблем.