Genie показала точность более 90% в внутренних тестах по анализу корпоративных данных

Новость

Редактор новостной ленты

5/10/2026, 12:42:32 AM

Genie — дата‑агент для сложных запросов по структурированным (таблицы, дашборды, ноутбуки) и неструктурированным (файлы рабочего пространства, Google Drive, SharePoint) корпоративным источникам;

Genie добилась точности выше 90% на внутренних тестах при решении сложных аналитических задач по корпоративным данным — результат, который авторы считают критичным для практического развёртывания дата‑агентов в реальных предприятиях. Это означает, что система значительно улучшает качество ответов по широкому набору источников и сокращает риски ошибочных выводов при расследовании метрик и бизнес‑отчётов. Система ориентирована на объединённый поиск и анализ сотен тысяч активов: таблиц, дашбордов, ноутбуков и документов, а также файлов рабочего пространства, Google Drive и SharePoint. В основе архитектуры — несколько технических приёмов: специализированный поиск знаний для отбора релевантных активов, параллельное «мышление» (parallel thinking) для независимой генерации гипотез и Multi‑LLM дизайн с оптимизированными промптами.

Image 5: Figure 2: An example trajectory showing how Genie solves a complex user query across different phases: parallel multi-agent asset discovery, data investigation (SQL extraction, comparative analysis, root-cause investigation), self-correction and reconciliation, and final verification.

параллельное мульти‑агентное обнаружение источников, извлечение и исследование данных (включая формирование SQL‑запросов и сравнительный анализ), цикл самокоррекции и итоговая верификация результатов. На внутреннем бенчмарке авторы сравнили подход Genie с ведущим кодинг‑агентом и отметили рост точности с 32% до более чем 90%. Кроме того, по материалу наблюдалось заметное снижение затрат и латентности по сравнению с «универсальным» кодинг‑агентом — в публикации приведён график экспериментов для визуального сравнения. В тексте также подчёркивается различие ролей: кодинг‑агенты работают эффективно в относительно статичных и детерминированных средах (файловая система, код), тогда как дата‑агентам приходится оперировать динамичным lakehouse с большим семантическим контекстом.

Image 6: Figure 3: The key technical advances in Genie: i) Specialized Knowledge Search, ii) Parallel Thinking, and iii) Multi-LLM that allow for significant improvements in accuracy and latency.

Авторы выделяют три ключевые проблемы для таких систем: масштаб обнаружения данных, определение «источника истины» при противоречивых бизнес‑данных и отсутствие верифицируемых тестов для итеративной отладки ответов. Практическое значение подхода заключается в автоматизации межсистемного обнаружения и расследования несогласованных метрик, что сокращает ручной труд аналитиков и ускоряет выявление корневых причин. Важной особенностью является способность агента фиксировать случаи неполноты данных и запускать цикл самокоррекции, а при неопределённости — прозрачно возвращать соответствующий уровень уверенности пользователю. решение требовало сквозного поиска по таблицам, документам и настройкам отчётности, а также выделения контрактных ставок ценообразования. На внутренних тестах Genie демонстрирует пошаговый путь решения таких запросов в четырёх фазах — от параллельного поиска по источникам до верификации итогов.

Image 7: Figure 4: Comparison of Specialized Knowledge Search for Table Search performance.

Источники

Databricks Blog · 5/8/2026

Ответы (0)

Пока нет ответов в этой теме.