
Учебник показывает полный практический пример создания и запуска end‑to‑end конвейера на ZenML: от настройки окружения и инициализации репозитория до определения кастомного материализатора, параллельного поиска гиперпараметров и логирования метаданных.
В руководстве представлен пошаговый пример реализации end‑to‑end ML‑конвейера на ZenML: авторы описывают установку зависимостей, инициализацию рабочей директории и настройку окружения, включая переменные ZENML_ANALYTICS_OPT_IN=false и ZENML_LOGGING_VERBOSITY=WARN. Репозиторий ZenML создаётся и конфигурируется так, чтобы последующие шаги конвейера корректно отслеживались и кэшировались. Для рабочей среды показаны конкретные команды установки (например, pip‑пакеты zenml[server], scikit‑learn, pandas, pyarrow) и скрипт создания чистой директории проекта. После настройки авторы устанавливают зависимости и структуры проекта, необходимые для последовательного исполнения шагов и сохранения артефактов.
Код реализации включает определение класса DatasetBundle и соответствующего DatasetBundleMaterializer для сериализации данных и извлечения связанной метаинформации, реализацию шагов загрузки и препроцессинга, а также модульный pipeline с «fan‑out» поиском гиперпараметров по нескольким моделям: RandomForestClassifier, GradientBoostingClassifier и LogisticRegression. Каждое исполнение конвейера оценивается по метрикам accuracy, f1 и roc_auc, при этом в процессе логируется богатый набор метаданных. Технически решение опирается на возможности ZenML — API pipeline/step, log_metadata, объект Model и контекст шагов, а также на базовые материалайзеры и типы артефактов. Авторы подчёркивают использование механизмов контроля моделей, отслеживания артефактов и кэширования для обеспечения воспроизводимости и прозрачности.
лучшая модель выбирается через стратегию fan‑in и может быть промотирована дальше с сохранением всех артефактов и метрик.
Источники
Ответы (0)
Пока нет ответов в этой теме.