Практические тесты GPT-5 и GPT-4o: точность против креативности
Ars Technica сравнила GPT-5 и GPT-4o в тестах на юмор, математику и креатив. Результаты: новая модель точнее в расчетах, но уступает в оригинальности.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Ars Technica сравнила GPT-5 и GPT-4o в тестах на юмор, математику и креатив. Результаты: новая модель точнее в расчетах, но уступает в оригинальности.
Мобильное приложение ChatGPT достигло $2 млрд выручки с показателем $2.91 на установку, опережая конкурентов в 30 раз. Анализ Appfigures подтверждает доминирование OpenAI.
Релиз GPT-5 разочаровал ожидания революции, но принёс практические улучшения в скорости и стоимости. Модель лидирует в генерации кода, что может стать основой монетизации для OpenAI.
Исследование Nous Research показало: open-source ИИ-модели потребляют до 10 раз больше токенов, чем коммерческие аналоги, что делает их дороже при эксплуатации. Эффективность OpenAI контрастирует с расточительностью LRM-моделей.
Salesforce представила систему LEoptical, где ИИ-агенты автономно управляют маркетингом, сервисом и лояльностью клиентов. Решение победило в конкурсе Agentic Marketing Showdown, демонстрируя новый подход к бизнес-автоматизации.
Google представила Gemma 3 270M — ИИ-модель для смартфонов и браузеров. Всего 270 млн параметров, энергоэффективность 0.75% батареи на 25 диалогов и 51.2% в тестах. Доступна для кастомизации с ограничениями.