Вице-президент OpenAI по исследованиям Макс Шварцер объявил о переходе в стан прямого конкурента — стартапа Anthropic. Как сообщает издание Storyboard18, топ-менеджер намерен оставить административные функции и вернуться к прикладной научной работе в качестве индивидуального исследователя (IC), сфокусировавшись на обучении с подкреплением (RL).

Шварцер, игравший ключевую роль в разработке последних моделей OpenAI, подчеркнул, что его решение продиктовано желанием «вновь оказаться в гуще технических задач». В Anthropic он присоединится к группе специалистов, чьи «исследовательский вкус и ценности» он оценивает крайне высоко, отметив, что в эту компанию уже перешли многие люди, которым он доверяет больше всего.

За последний год Макс Шварцер возглавлял команду пост-тренировки (post-training) в OpenAI. Под его руководством были выпущены такие модели, как GPT-5 и ее последующие итерации (5.1, 5.2), а также специализированная 5.3-Codex. Его послужной список также включает работу над парадигмой рассуждений (reasoning), алгоритмами для моделей семейства o1 и o3, а также масштабирование вычислений на этапе инференса (test-time compute).

В 2021 году из OpenAI ушел тогдашний вице-президент по исследованиям Дарио Амодеи, который основал свой стартап Anthropic, ставший ключевым конкурентом для OpenAI.

Стратегический дрейф талантов

Переход Шварцера — это не просто смена рабочего места, а симптом продолжающейся миграции «мозгов» из OpenAI. В своем прощальном сообщении он выразил признательность Сэму Альтману и коллегам, однако акцент на возвращении к статусу рядового исследователя в Anthropic выглядит как техничный укол в сторону разросшейся бюрократии OpenAI. Похоже, для топовых инженеров возможность «копаться в коде» в Anthropic становится привлекательнее, чем управление огромными департаментами в компании, все больше напоминающей классическую корпорацию.

Очередная миграция архитектора GPT-5 подтверждает: Anthropic окончательно превратился в «тихую гавань» для тех, кто устал от коммерческого агрегатора Альтмана. Однако упор на обучение с подкреплением (RL) в отрыве от огромных вычислительных мощностей OpenAI может оказаться лишь попыткой догнать уходящий поезд. Пока Anthropic собирает элитную команду «старой гвардии», их продуктовая линейка все еще страдает от вторичности, а фокус на ценностях часто подменяет собой сырую производительность. Ставка на чистую науку хороша, пока у инвесторов не заканчивается терпение.

Несмотря на скепсис относительно темпов коммерциализации Anthropic, компания продолжает методично собирать экспертизу в области Reinforcement Learning. Для индустрии это означает, что битва за «рассуждающие» модели переходит в фазу тонкой настройки алгоритмов, где личный опыт ведущих инженеров весит больше, чем количество видеокарт в кластере. Шварцер забирает с собой понимание внутренних процессов обучения флагманских моделей, что дает Anthropic легитимный шанс сократить технологический разрыв в следующем цикле обновлений.