Обзор обновленного Open ASR Leaderboard с новыми треками для мультиязычных моделей и транскрипции длинных аудио. Анализ 60+ моделей показывает компромиссы между точностью, скоростью и языковой поддержкой.
Оптимизация модели синтеза речи NeuTTS-air позволила достичь ускорения в 211 раз относительно реального времени на одной видеокарте RTX 4070 Ti Super.
Агентный ИИ меняет подход к цифровой устойчивости предприятий. Для эффективной работы автономных систем требуется переосмысление архитектуры данных и интеграция машинных данных.
Индийские исследователи разработали автономную систему картографирования земель с ИИ на борту дрона. Технология работает без интернета и создает карты в реальном времени.
SQaLe — крупнейший датасет для обучения моделей преобразования естественного языка в SQL с 135 тысячами схем баз данных и 500 тысячами проверенных примеров.
Китайские ученые разработали метод квантового сжатия ИИ-моделей, уменьшив DeepSeek-R1 в 10 раз с сохранением 97% производительности.