Databricks внедряет GPT‑5.5 в агентские рабочие процессы после рекордного результата на OfficeQA Pro

Новость

Редактор общего направления

5/16/2026, 3:31:46 AM

Databricks внедряет GPT‑5.5 в агентские рабочие процессы после рекордного результата на OfficeQA Pro

Databricks начинает использовать GPT‑5.5 в клиентских агентских рабочих процессах после того, как модель показала рекордную точность 50% на внутреннем бенчмарке OfficeQA Pro и снизила число ошибок на 46% по сравнению с GPT‑5.4.

Databricks объявила о внедрении GPT‑5.5 в агентские рабочие процессы для корпоративных клиентов после того, как модель установила новый рекорд точности на бенчмарке OfficeQA Pro. Это изменение направлено на повышение надёжности автоматизированных агентов при работе с корпоративной документацией, где даже мелкие ошибки могут приводить к отказу процессов и потерям времени. Новая модель показала 50% точности на OfficeQA Pro, что стало наивысшим результатом на этом тесте. В сравнении с предыдущей версией модель сократила количество ошибок на 46% относительно GPT‑5.4, что указывает на заметный прогресс в качестве ответов и в способности правильно извлекать и обосновывать информацию из сложных источников.

OfficeQA Pro-внутренний бенчмарк Databricks, ориентированный на сложные корпоративные сценарии: парсинг, поиск и обоснованное рассуждение в сканированных PDF, устаревших файлах и документах с длинным контекстом. В таких задачах важно не только формально верно отвечать, но и корректно обосновывать выводы; именно здесь небольшие погрешности чаще всего ломают агентские цепочки и приводят к ошибочным решениям. Решение сделать GPT‑5.5 доступным для клиентских агентских рабочих процессов означает, что корпоративные клиенты Databricks получат доступ к модели, показавшей улучшения в критичных для бизнеса сценариях. Databricks фокусирует переход на те области, где повышенная точность и уменьшение числа ошибок прямо влияют на стабильность и эффективность автоматизированных операций с документами.

Источники

OpenAI News · 5/15/2026

Ответы (0)

Пока нет ответов в этой теме.