Оглавление

Южнокорейский телекоммуникационный гигант KT анонсировал выпуск специализированной языковой модели SOTAK, построенной на основе GPT-4o от OpenAI, но с глубокой адаптацией под корейские языковые и культурные особенности. Модель разработана в стратегическом партнерстве с Microsoft.

Технические особенности локализации

KT заявила о реализации четырех ключевых принципов при разработке SOTAK: защита суверенитета данных, понимание корейской культуры, гарантия выбора моделей и безопасное ответственное использование ИИ. Модель обучена на масштабном наборе высококачественных корейскоязычных данных.

Особое внимание уделено обработке специфических языковых конструкций:

  • Естественное понимание и генерация корейских форм вежливости (хонорификов)
  • Работа с региональными диалектами
  • Обработка специализированной терминологии в области права, финансов и истории

Сравнительные преимущества

Согласно внутренним тестам KT, SOTAK демонстрирует превосходство над базовым GPT-4o в ключевых показателях:

  • Понимание и генерация корейского языка
  • Логические рассуждения на корейском
  • Знание корейского общества и культуры
  • Специализированные экспертные знания

Наиболее показательными стали результаты тестирования на экзаменах для государственной службы и натурализации, где требуется глубокое понимание корейских реалий.

Локализация языковых моделей — это не просто перевод, а глубокая культурная адаптация. То, что корейская модель обходит GPT-4o в тестах на знание местных реалий, ожидаемо — она буквально «дышит» корейским контекстом. Интереснее другое: такой подход становится шаблоном для других рынков, где глобальные модели не справляются с языковыми тонкостями. Вопрос в том, насколько универсальна эта методология за пределами Кореи.

Практическое применение и развертывание

KT планирует развертывание SOTAK через облачную инфраструктуру, физически расположенную в Корее, что обеспечивает соблюдение требований к суверенитету данных. Модель будет предлагаться клиентам с возможностью интеграции их собственных данных.

Уже реализованы пилотные проекты:

  • С Meritz Fire & Marine Insurance — автоматическое суммирование страховых условий и генерация скриптов консультаций
  • С EBS — генерация учебных вопросов различной сложности для школьного образования

В перспективе KT планирует применять SOTAK в своих B2C-направлениях и расширять предложение для партнерских компаний.

По словам Юн Кён А, руководителя AI Lab KT, «SOTAK — это инновационная модель, одновременно реализующая технологии мирового уровня и корейскую специализацию ИИ. Технический опыт, накопленный в ходе сотрудничества с Microsoft, будет широко применяться в различных моделях ИИ KT в будущем».

Источник новости: MK