Оглавление

Новое исследование на основе уникального датасета Compar:IA показывает, как французские пользователи интегрируют разговорный AI в повседневную жизнь. Анализ более 175 тысяч диалогов выявил неожиданные паттерны поведения.

Проблема понимания реального использования ИИ

Несмотря на массовое внедрение генеративного ИИ, до сих пор сложно понять, как люди действительно используют эти технологии в повседневной жизни. Рыночные отчеты фокусируются на показателях внедрения и роста индустрии, а академические исследования часто рассматривают контролируемые сценарии, которые могут не отражать реальное использование.

Ключевые результаты исследования

  • Французские пользователи в основном взаимодействуют с разговорным AI в технических областях (11%), образовательных контекстах (10%) и профессиональных сферах (9%)
  • Основные цели использования: обучение новому (27%), получение советов (19%), создание контента (16%) и поиск информации (16%)
  • Разные темы показывают различные паттерны задач: медицинские темы в основном связаны с поиском советов (50%), творческие темы делают акцент на создании контента (45%)
  • Французы предпочитают использовать ИИ как партнера для обучения (68%), а не просто автоматизатора задач (32%)

Исследование развенчивает миф о том, что ИИ в основном используется для автоматизации рутинных задач. Французские пользователи демонстрируют зрелый подход, где ИИ становится интеллектуальным партнером для обучения и развития, а не просто инструментом выполнения команд.

Методология анализа

Классификация и анализ диалогов с ИИ осложняется двумя факторами: многомерностью взаимодействий (цели пользователей, темы, стили отношений, задачи) и огромным объемом текстовых данных для анализа.

Визуальное моделирование тем для быстрого понимания

Исследователи создали топографическую карту паттернов использования ИИ с помощью инструмента визуального моделирования тем BunkaTopics. Этот подход, аналогичный фреймворку Anthropic, сохранял приватность пользователей, одновременно раскрывая естественные группировки в данных.

Неконтролируемый классификационный анализ

Ключевой вызов при изучении использования ИИ — избежать предвзятости, которая возникает при составлении категорий для анализа данных. Вместо навязывания предопределенных классификаций, система категорий возникает следующим образом из собственных диалогов.

Были проанализированы четыре измерения:

  • Задачи: функциональная цель обмена между пользователем и ИИ
  • Темы: домены, представленные в содержании диалогов
  • Эмоциональная вовлеченность: аффективная валентность и интенсивность
  • Сложность языка: лингвистическая сложность взаимодействий

Для эффективного анализа больших объемов данных использовалась модель LLaMA 3.3-70B для классификации большой выборки датасета по этим измерениям. Подход был валидирован через ручную аннотацию репрезентативной подвыборки, которая подтвердила высокую точность классификации (F1 score).

По сообщению Hugging Face, это первое масштабное исследование паттернов использования ИИ именно во франкоязычной среде.