LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

AutoBench запускает третий раунд масштабного тестирования LLM

Третий раунд AutoBench протестировал 33 языковые модели с рекордными 300,000 оценок. Запущена платформа autobench.org для прозрачного benchmarking.

Google обвиняют в манипуляции данными об экологическом следе ИИ Gemini

Google заявил о минимальном экологическом следе Gemini, но эксперты обвиняют компанию в манипуляции данными и сокрытии полной картины потребления ресурсов ИИ-системами.

DeepSeek-V3.1 обошла собственную модель рассуждений в бенчмарках

DeepSeek представила гибридную модель V3.1 с двумя режимами работы, которая превзошла собственную модель рассуждений R1 в тестах при радикально низких ценах.

Google раскрыла энергопотребление Gemini в новом отчете об устойчивом развитии

Google впервые раскрыла данные об энергопотреблении ИИ-системы Gemini. Модели потребляют 10-15% энергии дата-центров компании, но эффективность улучшилась на 40%.

ByteDance выпустила языковую модель SEED OSS 36B с контекстом 512 тысяч токенов

ByteDance выпустила open-source языковую модель SEED OSS 36B с контекстом 512к токенов, усилив конкуренцию на рынке открытых ИИ-решений.

Claude для бизнеса получает инструменты администрирования, но без безлимитного доступа

Anthropic запустила корпоративную версию Claude с инструментами администрирования, но сохранила оплату за использование вместо безлимитных тарифов.