
Технический препринт OncoAgent опубликован 9 мая 2026 года (Team Article, upvote 2; автор Máximo López Chenlo).
Группа OncoAgent в мае 2026 года опубликовала технический препринт, описывающий открытую систему клинической поддержки решений для онкологии, спроектированную для приватного локального развёртывания в больницах и исследовательских подразделениях. По замыслу авторов, ключевое преимущество — сокращение зависимости от облачных провайдеров и уменьшение риска утечек данных при работе с чувствительной медицинской информацией, что важно для внедрения в клиническую практику. Архитектура платформы разделена на два уровня моделей: Tier 1 (~9B параметров) предназначен для типовых запросов и быстрого отклика, Tier 2 (~27B) — для сложного клинического рассуждения. Маршрутизация запросов между уровнями осуществляется с помощью механизма «additive complexity scorer», который оценивает сложность задачи и направляет её на соответствующий уровень обработки.
Для обучения обе модели использовали QLoRA на корпусе из 266,854 реальных и синтетических онкологических случаев, подготовленных с применением фреймворка Unsloth. По словам авторов, такое дообучение ориентировано на привязку ответов к клиническим руководствам и на снижение числа «галлюцинаций», типичных для монолитных LLM‑решений. Логика системы реализована через многоагентную топологию LangGraph: задачи декомпозированы на восемь специализированных узлов с ограниченными и аудитируемыми функциями. Для генерации и проверки ответов используется четырёхэтапный Corrective RAG (CRAG) с явным отбором релевантности через векторную базу данных, что, по мнению авторов, отличает подход от классических монолитных моделей и улучшает контроль над источниками информации.
Авторы прямо указывают на три основных проблемы существующих клинических моделей — галлюцинации, зависимость от облачных API и уязвимость монолитных архитектур при мультикоморбидных случаях — и позиционируют OncoAgent как решение через декомпозицию задач, локальный хостинг и строгие политики привязки к руководствам. Техническая реализация опирается на GPU AMD Instinct MI300X с 192 GB HBM3 и стек ROCm. Применение техники sequence packing позволило дообучить весь датасет примерно за 50 минут, что авторы оценивают как ~56× ускорение по сравнению с генерацией через облачные API. Система заявлена как полностью deployable on‑premises.
Вопросы безопасности решаются комбинированно: трёхслойный рефлексивный валидатор, жёсткая политика Zero‑PHI и механизмы CRAG. После пост‑фикса CRAG, утверждают авторы, показал 100% успешную градацию документов с средним RAG‑score ≈2.3+. При этом для клинического внедрения препринта подчёркивают необходимость внешней валидации, воспроизводимости результатов и проверки соответствия регуляторным требованиям; открытый код, по их мнению, упрощает такие проверки.
Источники
Ответы (0)
Пока нет ответов в этой теме.