На конференции Google I/O NVIDIA и Google Cloud сообщили о расширении своего совместного сообщества разработчиков: с момента запуска на прошлой I/O в сообщество вошли более 100 000 разработчиков, дата‑саентистов и инженеров машинного обучения. Это сообщество позиционируется как площадка для отработки навыков и ускоренного перехода от прототипов к продуктивным приложениям на основе стека NVIDIA AI в облаке Google. Для участников это значит более быстрый путь от эксперимента к продукту.
В этом году в сообществе появились новые обучающие материалы: траектория по использованию JAX на GPU NVIDIA, codelab NVIDIA Dynamo с фокусом на оптимизации инференса и ежемесячные стримы для разработчиков. Эти ресурсы призваны помочь инженерам осваивать оптимизации и практики, применимые к реальным нагрузкам и масштабным развертываниям.
За прошедший год сообщество стало хабом для практических проектов на инструментах с ускорением от NVIDIA: участники выводили в продакшн приложения с retrieval‑augmented generation на Google Kubernetes Engine и внедряли наблюдаемость для агентных нагрузок. Также разработчики экспериментировали с исследованиями крупных языковых моделей и гибридным on‑prem/cloud‑инференсом для прикладных сценариев — от спортивной аналитики до корпоративных конвейеров данных.
Интеграция обучающих материалов и инфраструктуры направлена на сокращение времени подготовки production‑ready решений: оптимизации JAX реализуются вплоть до многорукавных развертываний на NVIDIA‑оборудовании, MaxText в Google Cloud AI Hypercomputer задействует эти оптимизации для более эффективной тренировки больших моделей, а NVIDIA Dynamo на GKE помогает оптимизировать масштабный инференс, включая mixture‑of‑experts, для более эффективной подачи AI‑сервисов.
Источники
Ответы (0)
Пока нет ответов в этой теме.