Железо

Новости о технике и железе для искусственного интеллекта. GPU, TPU, специализированные AI-чипы от NVIDIA, AMD, Intel. Облачные платформы для ML, обзоры программного обеспечения, фреймворков и инструментов разработки. Аппаратное обеспечение для обучения и инференса нейросетей. Сравнения производительности и рекомендации по выбору.

Cloudflare представила платформу Omni

Cloudflare представила платформу Omni для эффективного запуска AI-моделей на ограниченных GPU

Cloudflare разработала платформу Omni для запуска большего количества AI-моделей на ограниченном числе GPU через интеллектуальное управление памятью и изоляцию процессов.

Проблемы масштабирования MoE-моделей: от теоретической эффективности к аппаратным ограничениям

Модели Mixture-of-Experts обещают эффективность, но сталкиваются с аппаратными ограничениями. Анализ проблем масштабирования и альтернативных решений от Cerebras.

Baseten добился 225% роста эффективности AI-инференса на Google Cloud

Baseten достиг 225% сокращения расходов для AI-инференса через комбинацию NVIDIA Blackwell на Google Cloud и оптимизированного программного стека.

Microsoft создала оптический компьютер для решения сложных задач в 100 раз быстрее

Microsoft разработала аналоговый оптический компьютер, решающий сложные задачи в 100 раз быстрее с минимальным энергопотреблением. Технология успешно протестирована в банковской сфере и медицине.

Tesla представила мастер-план развития

Teslа представила новый мастер-план без конкретных деталей и сроков

Tesla представила третий мастер-план развития компании, но документ содержит лишь общие фразы без конкретных сроков и технических деталей реализации.

AMD

AMD представляет новые AI-чипы для борьбы с доминированием Nvidia

AMD анонсировала новые AI-чипы Instinct MI325X и MI350 series, которые бросают вызов доминированию Nvidia на рынке ускорителей для искусственного интеллекта.