Космические силы США поднимают секретность на новые высоты перед ключевым запуском

Космические силы США установили беспрецедентный уровень секретности перед стратегическим запуском, отказавшись раскрывать детали миссии. Эксперты связывают это с испытанием новых технологий и геополитической обстановкой.

«Крёстный отец ИИ» назвал единственный шанс человечества против сверхразума

Джеффри Хинтон заявил, что человечество выживет лишь при глобальном регулировании сверхразумного ИИ. Почему его план почти нереализуем — анализ.

YouTube внедряет ИИ для оценки возраста пользователей: что важно знать

YouTube внедряет ИИ-системы для оценки возраста пользователей без верификации. Алгоритмы анализируют поведение, но точность и приватность вызывают вопросы экспертов.

OpenAI пообещала не удалять старые модели ChatGPT без предупреждения после скандала с GPT-5

OpenAI изменит политику вывода моделей из эксплуатации после скандала с GPT-5. Теперь компания будет предупреждать за 30 дней и сохранять API-доступ к старым версиям ещё 90 дней.

FilBench: бенчмарк для оценки языковых моделей теперь понимает филиппинские языки

Hugging Face представил FilBench — первый бенчмарк для оценки LLM на филиппинских языках. Тестирование 41 модели выявило лидеров и слабые места, особенно в генерации текста.

TextQuests оценил, насколько эффективны языковые модели в текстовых играх

Новый бенчмарк TextQuests на классических текстовых играх вскрыл слабости LLM в долгосрочном планировании и пространственном мышлении. Модели галлюцинируют в длинных сессиях и неэффективно тратят вычислительные ресурсы.