Thinking Machines Lab решает проблему случайности ответов ИИ

Thinking Machines Lab раскрыла первый технический проект по созданию детерминированных ИИ-моделей с воспроизводимыми ответами через контроль ядер GPU.

Оглавление

Проблема недетерминированности ИИ
Технический подход
Бизнес-последствия
Культура открытости vs коммерческая тайна

TechCrunch сообщает, что лаборатория Миры Мурати Thinking Machines Lab впервые раскрыла детали одного из своих проектов — создания ИИ-моделей с воспроизводимыми ответами. Это первое техническое содержание от стартапа, который привлек $2 миллиарда посевного финансирования и собрал команду из бывших исследователей OpenAI.

Проблема недетерминированности ИИ

В записи блога под названием «Победа над недетерминированностью в LLM-выводе» исследователь Horace He утверждает, что коренная причина случайности в ответах моделей — способ организации GPU-ядер, небольших программ, работающих внутри чипов Nvidia. Эти ядра по-разному комбинируются при обработке запросов, что и приводит к вариативности результатов.

Технический подход

Исследование предполагает, что тщательный контроль над уровнем оркестрации этих ядер может сделать ИИ-модели более детерминированными. Это особенно важно для:

Предприятий, требующих надежных и предсказуемых ответов
Научных исследований, где воспроизводимость критична
Обучения с подкреплением (RL), где последовательные ответы улучшают качество тренировки

Попытка сделать LLM детерминированными — это как пытаться заставить котов ходить строем: технически возможно, но противоречит их природе. Интересно, не потеряем ли мы креативность и разнообразие ответов в погоне за предсказуемостью. Ведь иногда именно случайные инсайты делают ИИ по-настоящему полезным.

Бизнес-последствия

Thinking Machines Lab уже сообщила инвесторам о планах использовать RL для адаптации моделей под бизнес-задачи. Первый продукт, как заявила Мурати в июле, будет представлен в ближайшие месяцы и будет «полезен исследователям и стартапам, разрабатывающим пользовательские модели».

Культура открытости vs коммерческая тайна

Лаборатория обещает регулярно публиковать исследования, код и другую информацию, чтобы «приносить пользу обществу и улучшать собственную исследовательскую культуру». Это напоминает ранние обещания OpenAI, который со временем стал более закрытым. Остается вопрос: сможет ли Thinking Machines Lab сохранить открытость при оценке в $12 миллиардов.

Это исследование предлагает редкий взгляд внутрь одной из самых секретных ИИ-лабораторий Кремниевой долины. Реальный тест будет не в публикации записей блога, а в способности решать фундаментальные проблемы и создавать продукты, оправдывающие многомиллиардную оценку.

Новости

Стартап с командой из бывших сотрудников OpenAI борется со случайностью в ответах ИИ-моделей

Проблема недетерминированности ИИ

Технический подход

Бизнес-последствия

Культура открытости vs коммерческая тайна

Еще интереснее

Nvidia представила технологию KVTC с 20-кратным сжатием памяти для открытых LLM

Японская корпорация Rakuten выпустила новую модель Rakuten AI 3.0 под открытой лицензией

Perplexity запускает интеллектуальный маршрутизатор — систему Computer for Enterprise

ИИ-индустрия переходит от простого предсказания к рассуждениям благодаря RL

Оставить комментарий