Оглавление
Anthropic представила новую версию своей компактной языковой модели Claude Haiku 4.5, которая демонстрирует производительность, сравнимую с флагманской моделью компании пятимесячной давности, но при этом работает более чем в два раза быстрее и стоит на треть дешевле, сообщает Ars Technica.
Экономия без потери качества
Новая модель уже доступна всем пользователям приложения Claude, веб-версии и API. Если заявленные показатели Haiku 4.5 подтвердятся независимым тестированием, это будет означать серьезный прорыв в оптимизации языковых моделей — способность соответствовать производительности передовой кодирующей модели всего пятимесячной давности при одновременном снижении стоимости и увеличении скорости.
Anthropic предлагает семейство Claude в трех размерах: Haiku (малый), Sonnet (средний) и Opus (большой). Более крупные модели основаны на более обширных нейронных сетях и обычно обладают более глубокими контекстными знаниями, но работают медленнее и дороже.

Технология дистилляции
Благодаря технике дистилляции компании вроде Anthropic смогли создать меньшие модели ИИ, которые соответствуют возможностям более крупных старых моделей в функциональных задачах, таких как программирование, хотя обычно это достигается за счет сокращения хранимых знаний.
Это означает, что если вам нужен ИИ для глубокого и содержательного анализа внешней политики или мировой истории, лучше выбрать Sonnet или Opus (помня, что они тоже могут ошибаться и выдумывать). Но если требуется быстрая помощь в программировании, больше ориентированная на перевод концепций, чем на общие знания, Haiku может быть лучшим выбором благодаря скорости и низкой стоимости.
Ценовая политика и производительность
Haiku 4.5 включена для подписчиков веб-планов и приложений Claude. Через API модель оценивается в $1 за миллион входных токенов и $5 за миллион выходных токенов. Для сравнения, Sonnet 4.5 стоит $3/$15, а Opus 4.1 — $15/$75 за миллион токенов соответственно.
Модель служит более дешевой заменой двум старым моделям — Haiku 3.5 и Sonnet 4. «Пользователи, которые полагаются на ИИ для задач реального времени с низкой задержкой, таких как чат-ассистенты, агенты обслуживания клиентов или парное программирование, оценят сочетание высокой интеллектуальности и замечательной скорости Haiku 4.5», — пишет Anthropic.
На тесте SWE-bench Verified, измеряющем производительность в задачах программирования, Haiku 4.5 показала 73,3% по сравнению с аналогичным уровнем Sonnet 4 (72,7%). Модель также, согласно бенчмаркам Anthropic, превосходит Sonnet 4 в определенных задачах, таких как использование компьютеров.
Создание компактных, но мощных моделей — это настоящий тренд, который переворачивает представление о том, что качество требует огромных вычислительных ресурсов. Haiku 4.5 демонстрирует, что можно получить почти такую же производительность в программировании за треть цены — это серьезный удар по бизнес-моделям, построенным на продаже дорогих вычислений. Интересно, как на это отреагируют конкуренты.
Сравнение с конкурентами
Haiku 4.5 удивительно близко подбирается к тому, чего может достичь GPT-5 от OpenAI в этом конкретном наборе тестов, хотя, поскольку результаты самоотчетные и потенциально подобраны для соответствия сильным сторонам модели, к ним стоит относиться с долей скептицизма.
Тем не менее, создание небольшой, но способной модели программирования может иметь неожиданные преимущества для агентских настроек кодирования, таких как Claude Code. Anthropic разработала Haiku 4.5 для работы вместе с Sonnet 4.5 в многомодельных рабочих процессах. В такой конфигурации Sonnet 4.5 мог бы разбивать сложные проблемы на многошаговые планы, а затем координировать несколько экземпляров Haiku 4.5 для выполнения подзадач параллельно, подобно распределению рабочих для ускорения процесса.
Claude Sonnet 4.5, выпущенный в конце сентября, остается передовой моделью Anthropic и тем, что компания называет «лучшей доступной моделью для программирования».
Оставить комментарий