LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Anthropic переманивает пользователей ChatGPT

В Anthropic нашли необычный способ упростить миграцию данных для пользователей ChatGPT

Anthropic обновила Claude, добавив бесплатную функцию памяти и инструмент переноса данных из других чат-ботов. Компания рассчитывает таким образом привлечь пользователей из экосистем ChatGPT и Gemini.

Диффузионная языковая модель Mercury 2

Диффузионная языковая модель Mercury 2 от Inception обещает генерацию в 10 раз быстрее конкурентов

Inception Labs представила Mercury 2 — диффузионную языковую модель, работающую быстрее классических LLM. Архитектура параллельной генерации может изменить подход к инференсу и обучению ИИ-агентов.

Scientel запустила 6-триллионую модель

Компания Scientel запустила на суперкомпьютере гибридную модель DeepSeek на 6 трлн параметров

Scientel продемонстрировала масштабирование DeepSeek R1 до триллионного уровня параметров на суперкомпьютере OSC. Решение сочетает параллельные вычисления и NewSQL-архитектуру, делая ставку на локальные ИИ-системы вместо облачных API.

Anthropic покупает стартап Vercept

Anthropic покупает стартап Vercept, чтобы развивать computer use у Claude

Сделка с Vercept усиливает стратегию Anthropic по развитию «computer use» — способности Claude работать с реальными приложениями. Несмотря на прогресс в тестах, массовое внедрение таких агентских функций пока остаётся вызовом.

Apple представила Ferret-UI Lite

Apple представила Ferret-UI Lite — компактный ИИ для понимания интерфейсов

Ferret-UI Lite — компактная модель Apple для понимания экранов мобильных и десктопных приложений. Она демонстрирует высокие результаты на бенчмарках при работе локально, без облака. Однако сложные многошаговые сценарии пока остаются ограничением.

DeepSeek, Moonshot и MiniMax воруют у Claude

Anthropic обвиняет китайские ИИ-компании в масштабном копировании модели Claude

Anthropic заявила о масштабной операции по копированию Claude через «дистилляцию» ответов модели. По данным компании, китайские разработчики использовали фейковые аккаунты и прокси для обхода ограничений. Скандал разворачивается на фоне ужесточения экспортного контроля США и обвинений в использовании запрещённых чипов Nvidia.