Исследование показало, что навыки ИИ-агентов бесполезны в деле
Исследователи из MIT и UC Santa Barbara выяснили, что навыки ИИ-агентов, блестяще работающие в тестах, оказываются практически бесполезными в реальных сценариях.
Kimi — интеллектуальный ассистент от Moonshot AI с поддержкой линейки моделей K2 (Mixture-of-Experts, 1 триллион параметров). Платформа предлагает сверхдлинный контекст (до 256 тыс. токенов), онлайн-поиск, работу с файлами и OpenAI/Anthropic-совместимые API для бесшовной интеграции.
K2 создан как агентная модель — автономно планирует и выполняет многошаговые задачи, от анализа данных до вызова инструментов. Весовые коэффициенты доступны под модифицированной MIT-лицензией. Цена — $0,15–0,60 за 1 млн входных токенов, в 10–100 раз дешевле GPT-4 и Claude Opus.
Особенности:
api.moonshot.ai/v1).Ссылки:
Исследователи из MIT и UC Santa Barbara выяснили, что навыки ИИ-агентов, блестяще работающие в тестах, оказываются практически бесполезными в реальных сценариях.
Один из лидеров китайского рынка ИИ, стартап Moonshot AI, готовится к листингу в Гонконге и планирует радикально изменить структуру владения для привлечения новых инвестиций.
Китайские открытые модели ИИ захватывают рынок, позволяя Пекину конкурировать с США несмотря на дефицит чипов и экспортные ограничения.
Синтез речи переживает революцию: сложные архитектуры TTS уступают место простой связке языковой модели и нейросетевого кодека. Новый подход обеспечивает высокое качество, масштабируемость и мультимодальность.
Mistral выпустила Devstral 2 — семейство моделей для программирования с открытыми весами, но с ограничениями для крупного бизнеса. Младшая версия свободна для использования, а флагманская требует лицензии при доходе свыше $20 млн.
Китайская модель Kimi K2 Thinking от Moonshot AI превзошла GPT-5 и Claude 4.5 в ключевых тестах на рассуждения и программирование при конкурентной цене.