Оглавление

По сообщению VentureBeat, стартап Chronosphere стоимостью $1,6 миллиарда представил систему AI-Guided Troubleshooting — технологию для диагностики сбоев в программном обеспечении, которая не просто обнаруживает проблемы, но и объясняет свою логику.

Парадокс современной разработки: быстрый код, медленный дебаггинг

Исследование MIT и Университета Пенсильвании показывает, что генеративный ИИ увеличил количество еженедельных коммитов кода на 13,5%, при этом объемы лог-данных в предприятиях растут на 250% в год. Это создает фундаментальный разрыв: разработчики пишут код быстрее, но отладка остается рутинной работой.

Когда падает крупный e-commerce или банковское приложение, инженерам приходится анализировать миллионы точек данных — логи серверов, трейсы приложений, метрики инфраструктуры, последние деплои. Chronosphere предлагает решение на базе четырех ключевых компонентов:

  • Автоматизированные «Предложения» с обоснованными путями исследования
  • Temporal Knowledge Graph — постоянно обновляемая карта зависимостей системы
  • Блокноты расследований для документирования каждого шага
  • Построение запросов на естественном языке

Temporal Knowledge Graph: не просто карта, а история изменений

Мартин Мао, CEO Chronosphere, объясняет принципиальное отличие их подхода: «Это живая, учитывающая время модель вашей системы. Она объединяет телеметрию — метрики, трейсы, логи — контекст инфраструктуры, события изменений вроде деплоев и feature flags, и даже человеческий ввод вроде заметок и runbooks в единую запрашиваемую карту, которая обновляется по мере эволюции системы».

ИИ-инструменты обещают автоматизацию, но на деле создают новые проблемы — они генерируют код быстрее, чем люди успевают его понимать. Chronosphere попытался решить это, сохранив человека в петле, что разумно, учитывая, как часто ИИ-системы дают уверенные, но ошибочные ответы.

Инженер в центре: почему автоматизация не заменяет экспертизу

В отличие от полностью автоматизированных систем, Chronosphere сознательно оставил инженеров «за рулем». Мао называет это решением проблемы «уверенного, но неправильного руководства», характерной для ранних ИИ-инструментов observability.

«‘Сохранять контроль за инженерами’ означает, что ИИ показывает свою работу, предлагает следующие шаги и позволяет инженерам проверять или переопределять — никогда не принимает решения автоматически», — поясняет Мао.

Он описывает типичный сценарий: «Срабатывает SLO-алерт в модуле Checkout. Chronosphere немедленно показывает ранжированное Предложение: ошибки, похоже, начались в зависимом Payment сервисе. Инженер может нажать ‘Исследовать’, чтобы увидеть графики и логику, и, если все сходится, выбрать углубиться. По мере продвижения в Payment система адаптируется с новыми Предложениями для этого сервиса — все в одном виде, без переключения между вкладками».

Конкурентная битва на рынке observability

Chronosphere входит в переполненное поле конкурентов. Datadog, лидер рынка с капитализацией свыше $40 миллиардов, уже представил собственные ИИ-функции для устранения неполадок. То же сделали Dynatrace и Splunk.

Мао выделяет техническое отличие подхода Chronosphere: «Ранний ‘ИИ для observability’ сильно полагался на распознавание паттернов и суммаризацию, что обычно ломается во время реальных инцидентов. Эти подходы часто останавливаются на корреляции аномалий или производят беглые объяснения без глубокого анализа и причинно-следственных рассуждений, необходимых лидерам observability».

Конкурентное позиционирование Chronosphere получило подтверждение в июле, когда Gartner назвал компанию Лидером в Magic Quadrant for Observability Platforms 2025 второй год подряд.

Рынок observability сталкивается с растущим давлением по оправданию escalating costs, и подход Chronosphere, делающий ставку на объяснимый ИИ, может оказаться тем самым дифференцирующим фактором, который ищут предприятия, уставшие от «черных ящиков» в мониторинге.