Оглавление
TechCrunch сообщает, что лаборатория Миры Мурати Thinking Machines Lab впервые раскрыла детали одного из своих проектов — создания ИИ-моделей с воспроизводимыми ответами. Это первое техническое содержание от стартапа, который привлек $2 миллиарда посевного финансирования и собрал команду из бывших исследователей OpenAI.
Проблема недетерминированности ИИ
В записи блога под названием «Победа над недетерминированностью в LLM-выводе» исследователь Horace He утверждает, что коренная причина случайности в ответах моделей — способ организации GPU-ядер, небольших программ, работающих внутри чипов Nvidia. Эти ядра по-разному комбинируются при обработке запросов, что и приводит к вариативности результатов.
Технический подход
Исследование предполагает, что тщательный контроль над уровнем оркестрации этих ядер может сделать ИИ-модели более детерминированными. Это особенно важно для:
- Предприятий, требующих надежных и предсказуемых ответов
- Научных исследований, где воспроизводимость критична
- Обучения с подкреплением (RL), где последовательные ответы улучшают качество тренировки
Попытка сделать LLM детерминированными — это как пытаться заставить котов ходить строем: технически возможно, но противоречит их природе. Интересно, не потеряем ли мы креативность и разнообразие ответов в погоне за предсказуемостью. Ведь иногда именно случайные инсайты делают ИИ по-настоящему полезным.
Бизнес-последствия
Thinking Machines Lab уже сообщила инвесторам о планах использовать RL для адаптации моделей под бизнес-задачи. Первый продукт, как заявила Мурати в июле, будет представлен в ближайшие месяцы и будет «полезен исследователям и стартапам, разрабатывающим пользовательские модели».
Культура открытости vs коммерческая тайна
Лаборатория обещает регулярно публиковать исследования, код и другую информацию, чтобы «приносить пользу обществу и улучшать собственную исследовательскую культуру». Это напоминает ранние обещания OpenAI, который со временем стал более закрытым. Остается вопрос: сможет ли Thinking Machines Lab сохранить открытость при оценке в $12 миллиардов.
Это исследование предлагает редкий взгляд внутрь одной из самых секретных ИИ-лабораторий Кремниевой долины. Реальный тест будет не в публикации записей блога, а в способности решать фундаментальные проблемы и создавать продукты, оправдывающие многомиллиардную оценку.
Оставить комментарий