LLM

Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.

Scientel запустила 6-триллионую модель

Компания Scientel запустила на суперкомпьютере гибридную модель DeepSeek на 6 трлн параметров

Scientel продемонстрировала масштабирование DeepSeek R1 до триллионного уровня параметров на суперкомпьютере OSC. Решение сочетает параллельные вычисления и NewSQL-архитектуру, делая ставку на локальные ИИ-системы вместо облачных API.

Anthropic покупает стартап Vercept

Anthropic покупает стартап Vercept, чтобы развивать computer use у Claude

Сделка с Vercept усиливает стратегию Anthropic по развитию «computer use» — способности Claude работать с реальными приложениями. Несмотря на прогресс в тестах, массовое внедрение таких агентских функций пока остаётся вызовом.

Apple представила Ferret-UI Lite

Apple представила Ferret-UI Lite — компактный ИИ для понимания интерфейсов

Ferret-UI Lite — компактная модель Apple для понимания экранов мобильных и десктопных приложений. Она демонстрирует высокие результаты на бенчмарках при работе локально, без облака. Однако сложные многошаговые сценарии пока остаются ограничением.

DeepSeek, Moonshot и MiniMax воруют у Claude

Anthropic обвиняет китайские ИИ-компании в масштабном копировании модели Claude

Anthropic заявила о масштабной операции по копированию Claude через «дистилляцию» ответов модели. По данным компании, китайские разработчики использовали фейковые аккаунты и прокси для обхода ограничений. Скандал разворачивается на фоне ужесточения экспортного контроля США и обвинений в использовании запрещённых чипов Nvidia.

Deep-Thinking Ratio

Google выяснил, что «глубина мышления» повышает точность LLM и сокращает расходы вдвое

Google показал, что длина ответа снижает точность, а «глубокие» токены её повышают. Think@n отбрасывает слабые варианты на раннем этапе и почти вдвое уменьшает расходы при росте качества.

Синтез речи уходит от TTS-систем

Синтез речи из текста переходит от TTS-систем к LLM и нейросетевым кодекам

Синтез речи переживает революцию: сложные архитектуры TTS уступают место простой связке языковой модели и нейросетевого кодека. Новый подход обеспечивает высокое качество, масштабируемость и мультимодальность.