MegaTrain обучил модель на одном GPU

С помощью среды выполнения MegaTrain обучили 100b модель всего на одном GPU

Разработчики представили MegaTrain — среду выполнения, которая позволяет обучать модели объемом более 100 миллиардов параметров на одном GPU за счет глубокой оптимизации работы с оперативной памятью.

Гендиректор Palantir и будущее гуманитариев

Гендиректор Palantir предрекает закат гуманитарных профессий под натиском ИИ

Генеральный директор Palantir Алекс Карп заявил, что ИИ обесценит гуманитарное образование, отдав приоритет специалистам с прикладными навыками и профессиональным обучением.

видеогенераторы не world models

Исследователи предлагают не считать ИИ-генераторы видео «мировыми моделями»

Международная группа ученых представила OpenWorldLib и доказала, что популярные видеогенераторы вроде Sora лишены ключевых свойств моделей мира.

Claude Code и GPT-4.1 взломали Мексику

Claude Code и GPT-4.1 помогли хакеру-одиночке взломать IT-системы госсектора Мексики

Использование ИИ-ассистентов позволило хакеру в одиночку взломать девять госорганов Мексики и похитить данные сотен миллионов граждан.

Zhipu AI представила GLM-5.1

Zhipu AI представила GLM-5.1 — модель, способную сотни раз переосмысливать свои ошибки

Zhipu AI представила GLM-5.1 — модель, которая умеет переосмысливать свои ошибки в коде через сотни итераций и обходит конкурентов в специфических тестах.

Alibaba инвестирует $290 млн в Shengshu

Alibaba инвестирует $290 млн в стартап Shengshu, разрабатывающий «модели мира»

Alibaba возглавила раунд инвестиций в размере 290 миллионов долларов для стартапа Shengshu, сменив фокус с языковых моделей на системы понимания физического мира.