DeepSeek-V3.1 обошла собственную модель рассуждений в бенчмарках
DeepSeek представила гибридную модель V3.1 с двумя режимами работы, которая превзошла собственную модель рассуждений R1 в тестах при радикально низких ценах.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
DeepSeek представила гибридную модель V3.1 с двумя режимами работы, которая превзошла собственную модель рассуждений R1 в тестах при радикально низких ценах.
Google впервые раскрыла данные об энергопотреблении ИИ-системы Gemini. Модели потребляют 10-15% энергии дата-центров компании, но эффективность улучшилась на 40%.
ByteDance выпустила open-source языковую модель SEED OSS 36B с контекстом 512к токенов, усилив конкуренцию на рынке открытых ИИ-решений.
Anthropic запустила корпоративную версию Claude с инструментами администрирования, но сохранила оплату за использование вместо безлимитных тарифов.
Google обновил Gemini Live: ассистент теперь визуально указывает на объекты через камеру, управляет приложениями и говорит с эмоциями.
Heroku интегрировала GPT-4 в свою AI-платформу, упрощая разработчикам доступ к передовым языковым моделям без сложной инфраструктуры.