Hugging Face представил FilBench — первый бенчмарк для оценки LLM на филиппинских языках. Тестирование 41 модели выявило лидеров и слабые места, особенно в генерации текста.
Новый бенчмарк TextQuests на классических текстовых играх вскрыл слабости LLM в долгосрочном планировании и пространственном мышлении. Модели галлюцинируют в длинных сессиях и неэффективно тратят вычислительные ресурсы.
Lambda запустила инстансы с 8 GPU NVIDIA B200 по $4.99/GPU-час. Архитектура Blackwell обещает 3× ускорение обучения LLM и 15× рост скорости инференса.
Капитализация Nvidia достигла $4 трлн благодаря ИИ-буму. Microsoft и Meta инвестируют $150+ млрд в GPU-инфраструктуру, укрепляя монополию компании. Анализ перспектив и рисков.
Тонкая настройка ИИ
Nscale запустил serverless-платформу для дообучения open-source ИИ-моделей без управления инфраструктурой. Тарификация за токены, live-мониторинг и $5 на тесты.
Анализ манифеста Цукерберга о персональном ИИ: за риторикой о свободе творчества скрывается стратегия Meta по захвату данных через умные очки. Экспертная оценка рисков.