Исследование показало, что галлюцинации — фундаментальное свойство LLM
Языковые модели страдают от избыточной уверенности из-за особенностей архитектуры и методов обучения. Разбираемся, как специалистам работать с галлюцинациями ИИ.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Языковые модели страдают от избыточной уверенности из-за особенностей архитектуры и методов обучения. Разбираемся, как специалистам работать с галлюцинациями ИИ.
Xiaomi представила MiMo-V2-Pro — мощную языковую модель для ИИ-агентов, которая обходит западные аналоги по соотношению цены и производительности.
Nvidia представила метод KVTC, позволяющий радикально снизить требования к видеопамяти для работы языковых моделей без изменения их весов.
Корпорация Rakuten представила новую языковую модель Rakuten AI 3.0, оптимизированную для японского языка, и опубликовала её в открытом доступе под лицензией Apache 2.0.
Perplexity представила платформу Computer for Enterprise для оркестрации ИИ-моделей, пытаясь убедить бизнес в безопасности своей архитектуры на базе Firecracker.
Искусственный интеллект переходит от простого предсказания к рассуждению и действиям благодаря обучению с подкреплением. Узнайте, как RL, цифровые двойники и четкие функции вознаграждения помогают бизнесу решать реальные задачи.