Scale запускает SEAL Showdown — рейтинг LLM на основе отзывов реальных пользователей
Scale запустила SEAL Showdown — первый рейтинг языковых моделей на основе оценок реальных пользователей из 100+ стран с детальной сегментацией по демографии.
Последние новости о больших языковых моделях (LLM): GPT, Claude, Gemini, LLaMA и другие. Обзоры новых релизов, сравнения моделей, анализ возможностей и ограничений современных LLM. Следите за развитием технологий искусственного интеллекта в области обработки естественного языка. Практические кейсы применения, туториалы и экспертные мнения.
Scale запустила SEAL Showdown — первый рейтинг языковых моделей на основе оценок реальных пользователей из 100+ стран с детальной сегментацией по демографии.
Годовое исследование AAAS показало, что ChatGPT плохо справляется с суммаризацией научных статей, жертвуя точностью ради простоты и требуя такой же проверки фактов, как ручное написание.
Сравнение Perplexity и ChatGPT в 2025 году: скорость, точность и творческий потенциал двух ведущих языковых моделей с экспертным анализом сильных сторон каждой платформы.
Google Research представила TTD-DR — систему, которая моделирует написание исследовательских отчетов как диффузионный процесс, достигая новых рекордов качества.
WRITER выпустила семейство компактных языковых моделей Palmyra-mini с рекордной производительностью до 15,6 тыс. токенов/с на одном GPU и конкурентными способностями к рассуждению.
xAI представила оптимизированную языковую модель Grok 4 Fast с экономией вычислений до 40% и снижением стоимости задач на 98% при сохранении производительности уровня GPT-5.