
Databricks объявила о партнерстве с OpenAI для интеграции новейшей флагманской языковой модели GPT-5.5 в свою платформу. Эта интеграция, управление которой будет осуществляться через систему Unity AI Gateway, призвана обеспечить корпоративным клиентам безопасный и масштабируемый доступ к передовым возможностям искусственного интеллекта. В рамках данного соглашения на платформе Databricks также станет доступен обновленный агент Codex, специализированный инструмент для работы с программным кодом, который теперь функционирует на базе архитектуры GPT-5.5.
Ключевой особенностью модели GPT-5.5 является ее способность к автономному выполнению сложных, многокомпонентных задач в корпоративной среде. В отличие от предыдущих поколений, требующих пошагового контроля, новая система может самостоятельно планировать свои действия, использовать различные программные инструменты, восстанавливаться после неоднозначных ситуаций и проверять собственные результаты. Разработчики отмечают, что модель успешно осуществляет полный цикл интеллектуальной работы: от поиска и анализа информации до написания кода, создания документов, работы с электронными таблицами и управления программным обеспечением.
Для объективной оценки того, как эти теоретические улучшения проявляют себя в реальных корпоративных сценариях, исследовательская группа Databricks в составе Ханлина Танга, Ахмеда Билала, Арнава Сингхви, Ивана Чжоу и Хариша Гаура провела комплексное тестирование модели. В качестве основного инструмента использовался внутренний бенчмарк OfficeQA, специально созданный для анализа способности нейросетей справляться со сложными многоэтапными аналитическими задачами. Данный набор тестов сформирован на основе массива из восьмидесяти девяти тысяч страниц официальных бюллетеней Министерства финансов США. Эта база позволяет проверять навыки поиска информации в объемных документах, интерпретации сложных таблиц и выполнения точных расчетов с использованием реальных корпоративных данных.
Первый этап тестирования был направлен на определение предельных возможностей модели в условиях, когда процесс поиска документов уже предварительно настроен. В испытании под названием OfficeQA Pro LLM, где использовались базы Oracle PDF в сочетании с веб-поиском, модель GPT-5.5 продемонстрировала результат в 64,66 процента успешных выполнений. Для сравнения, предыдущая версия системы, GPT-5.4, в аналогичных условиях показала результат на уровне 57,14 процента. По заявлению исследователей Databricks, это означает прирост производительности примерно на 13 процентов и устанавливает новый рекордный уровень качества работы для данного бенчмарка в задачах, требующих сложного рассуждения над документами.
Наиболее показательные результаты были зафиксированы в ходе второго этапа, который имитировал полноценный автономный рабочий процесс без предварительной подготовки данных. В режиме OfficeQA Pro Agent Harness модели требовалось самостоятельно найти необходимые документы, проанализировать их структуру и произвести вычисления, используя инструментарий агента Codex. В этом комплексном сценарии GPT-5.5 достигла показателя в 52,63 процента, что является существенным скачком по сравнению с результатом в 36,10 процента у версии GPT-5.4. Таким образом, количество ошибок при выполнении автономных сквозных задач сократилось на сорок шесть процентов, подтверждая практическую применимость обновленной архитектуры.
Внедрение GPT-5.5 через инфраструктуру Databricks и защищенный шлюз Unity AI Gateway решает важную задачу использования генеративного искусственного интеллекта в бизнесе, гарантируя контроль и безопасность данных. Хотя точные сроки публичного релиза в исходной публикации не раскрываются и обозначены лишь как «в ближайшее время», представленные метрики указывают на значительный прогресс в создании систем — агентов. Способность модели брать на себя выполнение неструктурированных задач от начала до конца знаменует новый этап в автоматизации рутинной аналитической и инженерной работы на уровне предприятий.
Источники
Ответы (0)
Пока нет ответов в этой теме.