NVIDIA выпустила модель Nemotron-8B-Embed для генерации векторных представлений текста. Модель доступна в двух версиях с разной длиной контекста и предназначена для семантического поиска и анализа текстовых данных.
Обзор самых разочаровывающих запусков ИИ в 2025 году: от GPT-5 до Meta* Vibes. Почему обещания не совпали с реальностью и что пошло не так у лидеров индустрии.
Новая технология SuperOffload позволяет проводить тонкую настройку LLM до 70B параметров на суперчипах NVIDIA GH200 с ускорением до 4 раз и производительностью 600 TFLOPS.
Практическое руководство по эффективному тонкому настрою Llama 3.1 с использованием Unsloth и QLoRA для кастомизации языковых моделей под конкретные задачи.
Google Research разработала гибридный метод, сочетающий каскады и спекулятивное декодирование для ускорения работы языковых моделей без потери качества генерации.
Together AI обновила платформу для тонкой настройки ИИ-моделей: поддержка 100B+ параметров, удвоение длины контекста и прямая интеграция с Hugging Face Hub.