Оглавление

Databricks анонсировала выход в публичный превью функции Governed Tags в Unity Catalog — решения для централизованного управления метками данных и ИИ-активов. Технология позволяет администраторам устанавливать единые стандарты тегирования во всех каталогах и рабочих областях платформы.

Решаем проблему несогласованных меток

По мере роста числа активов в дата-платформах возникает классическая проблема: разные команды используют различные варианты тегов для одинаковых сущностей. Один отдел помечает данные как «finance», другой — «fin», что затрудняет поиск, аудит и управление доступом. Governed Tags решают эту проблему через политики тегирования на уровне аккаунта.

Анимированная демонстрация процесса создания управляемого тега для маркировки данных
Источник: www.databricks.com

Ключевые сценарии использования

Новая функция предлагает три основных преимущества:

  • Обнаружение данных: Единообразные теги позволяют находить все релевантные активы независимо от вариантов написания
  • Управление и соответствие требованиям: Упрощается классификация данных и проведение аудитов, особенно в сочетании с Data Classification и Attribute-Based Access Control
  • Атрибуция затрат: Точное отслеживание использования ресурсов и затрат по командам и проектам

Как работают управляемые теги

Администраторы определяют разрешенные значения тегов, контролируют, кто может их применять, и где они могут использоваться. Важно, что существующие назначения тегов не удаляются — они автоматически становятся управляемыми после создания соответствующей политики.

Внутренний вид интерфейса управляемых тегов с опциями управления метками
Источник: www.databricks.com

Проблема несогласованного тегирования — одна из самых недооцененных в управлении данными. Кажется, мелочь, но именно такие «мелочи» потом оборачиваются часами ручной работы при аудитах и сложностями в автоматизации политик доступа. Решение Databricks выглядит прагматичным — не ломает существующую настройку, но задает правила на будущее. Интересно, как это скажется на уровне принятия: многие ли команды добровольно откажутся от привычных «творческих» практик тегирования.

Практическое внедрение

Governed Tags уже доступны в публичном превью на всех поддерживаемых регионах AWS, Azure и Google Cloud. Функция работает с таблицами, представлениями, томами, каталогами, схемами и колонками, с планируемым расширением на дашборды и ноутбуки.

Управляемый тег с синей иконкой замка, обозначающий защищенный статус
Источник: www.databricks.com

Рекомендуется постепенное внедрение с предварительным анализом существующих тегов. В ближайших релизах ожидается интеграция с serverless регистрами учета и расширение поддержки различных типов активов.

По материалам Databricks.