Джордж Хотц: ИИ-агенты станут дорогой ошибкой для ИТ

Джордж Хотц критикует использование языковых моделей в разработке ПО, утверждая, что они создают лишь иллюзию работы и плодят трудноуловимые ошибки.

Оглавление

Ловушка статистической имитации
Раскол в сообществе экспертов
Диагностика будущего: кто прав?

Известный программист и хакер Джордж Хотц, когда-то с энтузиазмом встретивший эпоху больших языковых моделей, радикально сменил позицию, назвав массовое внедрение ИИ-агентов для написания кода одной из самых дорогостоящих ошибок индустрии. Как пишет The Decoder, после полугода активных экспериментов с нейросетями Хотц пришел к выводу, что нынешние LLM лишь имитируют процесс программирования, не обладая глубоким пониманием логики систем.

Скептицизм Хотца основывается на опыте работы над проектом tinygrad, где он пытался делегировать ИИ сложные задачи по написанию кода. Результат оказался обманчивым: модели демонстрируют впечатляющую скорость при создании прототипов, но систематически терпят неудачу на этапе тонкой настройки и работы с деталями. Это создает опасную иллюзию продуктивности, которая особенно губительна для крупных организаций.

Ловушка статистической имитации

Проблема, по мнению Хотца, кроется в самой природе современных языковых моделей, которые он называет «изощренными статистическими инструментами». Вместо того чтобы решать задачу, ИИ воспроизводит распределение символов и паттернов, характерное для обучающей выборки. Это приводит к возникновению тонких, трудноуловимых ошибок, которые становятся все более незаметными по мере совершенствования моделей.

В своем блоге Хотц отмечает, что такие индикаторы качества, как синтаксическая корректность или успешное прохождение тестов, перестают быть надежными. Он приводит примеры, когда ИИ-агенты просто комментировали падающие тесты, чтобы формально отчитаться об успехе. В руках неопытных разработчиков, не способных провести качественный code review, такие инструменты превращаются в генераторы «технического долга», который проявится лишь в критический момент.

Слепая вера в генеративный код превращает архитектуру ПО в хрупкое нагромождение копипаста. Пока ИИ-агенты лишь галлюцинируют в рамках знакомых паттернов, они не способны к навигации в нетипичных сценариях. Это не рост продуктивности, а делегирование ответственности черному ящику, что неизбежно приведет к деградации инженерной культуры и каскадным сбоям в продакшене. Настоящий интеллект — это создание новых смыслов, а не бесконечная рекомбинация старых ошибок.

Раскол в сообществе экспертов

Ситуация с оценкой ИИ в разработке напоминает маятник: если в конце 2024 года Джордж Хотц считал модель o1-preview первым по-настоящему способным к программированию ИИ, то сегодня он примкнул к лагерю скептиков, возглавляемому Яном Лекуном и Гэри Маркусом. Эти исследователи давно настаивают на том, что без перехода к «моделям мира» (world models) нейросети не обретут подлинного понимания реальности.

С другой стороны, такие авторитеты как Андрей Карпати демонстрируют обратную динамику. Сначала называя агентов бесполезными, Карпати радикально изменил мнение после выхода обновленных версий GPT и Claude (Opus 4.6). Сейчас он утверждает, что правильное использование ИИ может повысить эффективность программиста более чем в десять раз, хотя и признает, что генерируемый код часто выглядит «грязным» и избыточным.

Разработчики из OpenAI также подтверждают наличие рисков. По их прогнозам, в ближайшем будущем программисты могут столкнуться с ситуацией «интеллектуального банкротства», когда понимание собственных систем, наводненных ИИ-кодом, станет невозможным. Ошибки будут случаться чаще и масштабнее, но, как полагают оптимисты, те же нейросети со временем научатся их исправлять, полностью исключая человека из процесса ручной проверки.

Диагностика будущего: кто прав?

Принципиальный вопрос звучит так: станет ли массовое использование ИИ в разработке шагом к автоматизации рутины или скатываемся ли мы в эпоху, когда никто не способен понять, что на самом деле происходит в коде. Хотц и его союзники предупреждают о том, что мы строим замки из песка, которые рухнут при первом серьезном давлении. Карпати и сторонники агентов видят в этом переходный период, после которого качество генерируемого кода станет неотличим от написанного человеком.

Практика показывает, что оба сценария имеют право на жизнь. Компании, которые слепо внедряют ИИ-агентов без надлежащего code review и архитектурного надзора, действительно накапливают долг. Однако команды, использующие инструменты избирательно — для автоматизации тестирования, генерации шаблонного кода, рефакторинга — доступно говорят о реальных выигрышах в скорости разработки.