
2 июня 2026 года команда Hcompany представила Holo3.1 — обновление семейства моделей для агентов, управляющих пользовательским интерфейсом. Релиз добавляет квантизованные чекпоинты (FP8, NVFP4, Q4 GGUF), новые размеры моделей (0.
2 июня 2026 года команда Hcompany выпустила Holo3.1 — новую итерацию семейства моделей для агентов, управляющих пользовательскими интерфейсами. Релиз нацелен на повышение надежности и переносимости поведения агентов в разных продуктах и средах запуска, что важно для команд, которые интегрируют такие модели в реальные продукты и хотят сократить риски рассогласования при переходе в продакшен.
База Holo3.1 опирается на семейство Qwen и вводит нативную поддержку протоколов function‑calling в дополнение к структурированным JSON‑выходам предыдущей версии. Это упрощает интеграцию в сторонние агентские стеки и снижает вероятность рассогласований форматов вывода при переносе решений в продакшен, что особенно полезно для автоматизации в мобильных приложениях и межфреймворковой работы.
По внутренним бенчмаркам релиз показал заметный прирост качества. На наборе AndroidWorld версия 35B‑A3B улучшилась с 67% до 79.3%, а меньшие 4B и 9B выросли с 58% до 72%. В тестах внутри продукта Holotab Holo3.1 обеспечивает более чем 25% улучшение по сравнению с Holo3; функциональность function‑calling и «нативное» выполнение достигли близкой паритета по набору OSWorld и по внутренним сценарием (e‑commerce, бизнес‑ПО, collaboration).
Для локального инференса Holo3.1 включает NVFP4‑чекпоинты, подготовленные с помощью NVIDIA Model Optimizer в конфигурации W4A16. На DGX Spark NVFP4 W4A16 демонстрирует 1.41× пропускной способности токенов относительно FP8 и 1.74× относительно BF16; при этом FP8 и NVFP4 показывают примерно на два балла ниже по OSWorld, чем BF16. Отдельно доступны Q4 GGUF‑чекпоинты, оптимизированные для потребительского железа и компактных локальных развёртываний.
Практическое значение релиза для разработчиков — расширение вариативности развертывания: от облачного инференса до полностью локального выполнения на устройстве пользователя, возможность выбрать меньшие модели для приватных или экономичных решений и улучшенная совместимость с разнообразными агентскими стеками. Holo3.1 позиционируется как шаг к «универсальным» агентам для управления компьютером, способным работать в вебе, на десктопе и мобильных платформах и на разном оборудовании.
Источники
Ответы (0)
Пока нет ответов в этой теме.