Cloudflare разработала платформу Omni для запуска большего количества AI-моделей на ограниченном числе GPU через интеллектуальное управление памятью и изоляцию процессов.
Модели Mixture-of-Experts обещают эффективность, но сталкиваются с аппаратными ограничениями. Анализ проблем масштабирования и альтернативных решений от Cerebras.
Baseten достиг 225% сокращения расходов для AI-инференса через комбинацию NVIDIA Blackwell на Google Cloud и оптимизированного программного стека.
Microsoft разработала аналоговый оптический компьютер, решающий сложные задачи в 100 раз быстрее с минимальным энергопотреблением. Технология успешно протестирована в банковской сфере и медицине.
Tesla представила третий мастер-план развития компании, но документ содержит лишь общие фразы без конкретных сроков и технических деталей реализации.
AMD анонсировала новые AI-чипы Instinct MI325X и MI350 series, которые бросают вызов доминированию Nvidia на рынке ускорителей для искусственного интеллекта.