Машинное обучение

Актуальные новости машинного обучения и нейронных сетей. Прорывы в области ML, новые алгоритмы, исследования от ведущих лабораторий. Практические применения машинного обучения в бизнесе, науке и повседневной жизни. Deep learning, computer vision, NLP и другие направления. Туториалы, гайды и экспертные материалы для специалистов.

Nonuniform Tensor Parallelism

NVIDIA может обучать LLM без пауз при помощи NTP — неравномерного тензорного параллелизма

NVIDIA представила технологию NTP, позволяющую динамически менять степень тензорного параллелизма для предотвращения простоев при обучении больших языковых моделей.

Meta ограничивает Claude Code и Codex

Meta* ограничивает использование Claude Code и Codex ради защиты своих данных

Компания Meta* ввела строгие ограничения на использование инструментов Claude Code от Anthropic и Codex от OpenAI своими инженерами. Это сделано для предотвращения попадания результатов работы чужих алгоритмов в собственные обучающие выборки и защиты интеллектуальной собственности.

Google OpenRL

Google представила OpenRL — API для тонкой настройки моделей внутри Kubernetes

Google представила OpenRL, open-source решение для дообучения языковых моделей на Kubernetes, которое разделяет управление инфраструктурой и исследовательскую работу.

Semi-Supervised Framework

Ученые предложили обучать ИИ на данных, размеченных другим ИИ на основе небольшого датасета

Исследователи представили метод обучения LLM рассуждениям с минимальной разметкой, используя специальный верификатор и энтропийную фильтрацию данных.

Mode Inc скупает приложения

Mode Inc скупает приложения, чтобы получить доступ к данным пользователей для обучения ИИ

Стартап Mode Inc активно скупает потребительские приложения, чтобы предоставить пользователям возможность зарабатывать на своих данных, которые затем используются для обучения ИИ-моделей.

Count Anything

Китайские ученые представили модель Count Anything, которая умеет только считать объекты

Новая модель Count Anything от исследователей Университета Цинхуа решает сложную задачу универсального подсчета объектов на изображениях разных типов с помощью текстовых подсказок.