
С запуском инстансов G7e на базе NVIDIA RTX PRO 6000, Amazon SageMaker предлагает разработчикам мощные инструменты для генеративного ИИ.
Amazon Web Services (AWS) объявила о запуске новых инстансов G7e, которые ускоряют процесс обработки генеративного ИИ с помощью сервисов Amazon SageMaker. Эти инстансы оснащены графическими процессорами NVIDIA RTX PRO 6000 Blackwell и обеспечивают доступ к 96 ГБ памяти GDDR7 на каждый GPU. Новые G7e позволяют разработчикам работать с мощными моделями, такими как GPT-OSS-120B и Qwen3.
G7e инстансы доступны в конфигурациях с 1, 2, 4 и 8 графическими процессорами и значительно превосходят предшественники G6e по производительности. Например, G7e.2xlarge поддерживает модели объемом до 35 миллиардов параметров, в то время как G7e.48xlarge справляется с моделями до 300 миллиардов параметров. Новинки обеспечивают невероятную скорость передачи данных — до 1,600 Гбит/с, что способствует многопоточности.
С запуском G7e, AWS усиливает свои позиции на рынке облачных вычислений, предлагая новые решения для крупных компаний, работающих с генеративным ИИ. Инстансы G7e обеспечивают до 768 ГБ общей памяти и в 2,3 раза повышают скорость обработки запросов по сравнению с G6e, что является важным конкурентным преимуществом.
Запуск G7e может коренным образом изменить реализацию высокопроизводительных приложений, таких как чат-боты, обработка текстов и генерация изображений. Увеличенная память и скорость помогут организациям сократить время обработки запросов и упростить операции, что приведет к снижению затрат и повышению продуктивности работы с новыми моделями ИИ.
Источники
Ответы (0)
Пока нет ответов в этой теме.