Оглавление

По сообщению DataRobot, компания выпустила Talk to My Docs (TTMDocs) — open-source шаблон приложения для создания AI-агентов, способных работать с документами из разных источников. Решение призвано решить проблему фрагментации знаний в организациях, где сотрудники тратят значительное время на поиск информации.

Скрытые издержки фрагментации знаний

Проблема разрозненных данных — не просто неудобство, а реальная угроза производительности. Исследование Starmind показало, что сотрудники используют лишь 38% доступных знаний из-за фрагментации. Аналитики McKinsey обнаружили, что специалисты тратят более четверти рабочего времени на поиск информации в Google Drive, Box и других системах.

Ограничения существующих решений

Большинство доступных инструментов имеют существенные ограничения:

  • Зависимость от поставщика — невозможность интеграции с неподдерживаемыми системами
  • Проблемы безопасности — сложности с соблюдением требований compliance

Архитектура Talk to My Docs

TTMDocs использует многоагентную архитектуру на базе CrewAI, что позволяет распределять задачи между специализированными агентами. Решение поддерживает интеграцию с Google Drive, Box, локальными файловыми системами, а в ближайших планах — поддержка Sharepoint и JIRA.

Ключевые особенности платформы:

  • Предоставляет готовые OAuth-интеграции для безопасной аутентификации
  • Сохраняет существующие права доступа — если у пользователя нет доступа к документу в Google Drive, он не увидит его и в TTMDocs
  • Интегрируется с Guarded RAG LLM Model для контролируемого извлечения документов
  • Обеспечивает полную наблюдаемость через платформу DataRobot

Практические применения

Решение находит применение в различных сценариях:

  • Due diligence при слияниях и поглощениях — анализ финансовых отчетов, юридических контрактов и технической документации
  • Клинические исследования — проверка соответствия протоколов испытаний регуляторным требованиям
  • Юридические исследования — поиск по годам переписки и контрактов с соблюдением контроля доступа
  • Страховые расследования — анализ полисов и оценок на предмет мошенничества

Интересно наблюдать, как DataRobot делает ставку на open-source подход в эпоху, когда большинство вендоров пытаются замкнуть клиентов на своих проприетарных решениях. Многоагентная архитектура — правильный ход для сложных корпоративных сценариев, где один универсальный агент часто не справляется. Вопрос в том, насколько легко компании смогут адаптировать этот шаблон под свои нужды без глубокой экспертизы в ML-инженерии. Технически грамотно, но порог входа для non-tech компаний остается высоким.

Архитектурно решение построено на модульных компонентах: FastAPI-бэкенд, React/Vite фронтенд, инфраструктура как код на Pulumi. Это позволяет развертывать систему поэтапно и масштабировать под конкретные бизнес-задачи.

Источник новости: DataRobot