Машинное обучение

Актуальные новости машинного обучения и нейронных сетей. Прорывы в области ML, новые алгоритмы, исследования от ведущих лабораторий. Практические применения машинного обучения в бизнесе, науке и повседневной жизни. Deep learning, computer vision, NLP и другие направления. Туториалы, гайды и экспертные материалы для специалистов.

Крупные LLM обучаются лучше

Исследование объяснило, почему крупные LLM обучаются лучше, чем небольшие модели

Долгое время считалось, что чем больше параметров в нейросети, тем она умнее. Новое исследование объясняет, что дело не только в абстрактной «мощности», а в способности модели справляться с внутренним шумом при усвоении редких данных.

Фреймворк ADASPEC

Проблему медленной генерации LLM в многоязычной среде может решить фреймворк ADASPEC

Японские исследователи представили ADASPEC — технологию, ускоряющую работу языковых моделей в многоязычном режиме за счет адаптивных словарей и самообучающихся моделей-черновиков.

ML рукописи

Машинное обучение используется для расшифровки средневековых рукописей

Искусственный интеллект становится ключевым инструментом в руках историков, позволяя расшифровывать многовековые документы и восстанавливать утраченные тексты.

alignment мозга и нейросети

Тренировочные данные определяют сходство ИИ с человеческим мозгом

Ученые выяснили, что соответствие нейросетей паттернам человеческого мозга продиктовано составом обучающих данных, опровергнув теорию об особом преимуществе английского языка в архитектурах ИИ.

MMProLong

Исследователи из ByteDance предложили новый метод обучения мультимодальных моделей

Исследователи ByteDance представили модель MMProLong, которая обходит конкурентов благодаря новой стратегии обучения на длинных документах через вопросы и ответы.

Token Superposition Training

Nous Research представила метод Token Superposition, ускоряющий обучение LLM до 2,5 раз

Компания Nous Research представила метод Token Superposition Training, позволяющий ускорить предварительное обучение LLM до 2,5 раз за счет работы с пакетами токенов.