Ускорение инференса на чипах AWS Trainium

Метод спекулятивного декодирования может ускорить инференс LLM на чипах AWS Trainium

Метод спекулятивного декодирования на чипах AWS Trainium позволяет сократить задержку генерации текста до 15 мс для структурированных задач.

Google представила Gemini 3.1 Flash TTS

Google представила Gemini 3.1 Flash TTS — модель синтеза речи на 70 языках

Google представила свою самую выразительную модель синтеза речи Gemini 3.1 Flash TTS с поддержкой 70 языков и уникальной системой управления через аудио-теги.

Из ИИ-браузеров утекают данные

Уязвимости в браузерах с ИИ-агентами открывают путь к краже данных

Браузеры с ИИ-агентами сталкиваются с новыми угрозами безопасности, превращающими обычные веб-ошибки в инструменты полного захвата сессии и кражи данных.

Google внедряет Skills в Chrome

Google внедряет функцию Skills внутри Chrome: можно сохранить промпт, не выходя из браузера

Google внедряет в Chrome функцию Skills для сохранения и быстрого повторного использования ИИ-промптов через интерфейс Gemini.

Claude решил задачу на alignment

Claude обошел человека в задаче на alignment, но провалился в реальных условиях

Автономные агенты Claude Opus 4.6 блестяще справились с исследовательской задачей в лаборатории, но не смогли улучшить работу реальных моделей в продакшене.

Databricks обновляет AI Gateway

Databricks обновляет AI Gateway — стало проще взять под контроль автономных ИИ-агентов

Databricks расширила возможности AI Gateway, предложив инструменты для управления сложными цепочками действий ИИ-агентов и защиты данных.