
Платформа Artificial Analysis присвоила NVIDIA Nemotron 3 Ultra 48 баллов, назвав её самой способной открытой моделью из США; модель демонстрирует свыше 300 токенов/с и выйдет в открытый доступ 4 июня.
Artificial Analysis поставила модель Nemotron 3 Ultra от NVIDIA на первое место среди открытых моделей, созданных в США, присудив ей 48 баллов — оценку, совмещающую показатели «интеллекта» и скорости. Это выделяет Nemotron 3 Ultra как практический вариант для приложений с высокой нагрузкой: высокая пропускная способность обещает лучшее поведение в реальных продуктах и исследованиях. Архитектура Nemotron 3 Ultra заявлена как примерно 550 миллиардов общих параметров, из которых около 55 миллиардов активны одновременно в режиме вывода. Artificial Analysis помещает модель в «наиболее привлекательный квадрант» своей диаграммы, что означает сочетание относительно высокого уровня интеллекта и быстрой выдачи ответов — критерий, важный для продакшен‑процесов и интерактивных интерфейсов.
В бенчмарках на провайдере DeepInfra Nemotron 3 Ultra показывает более 300 токенов в секунду, отмечает Artificial Analysis. В тех же условиях сопоставимые по размеру открытые модели демонстрируют существенно меньшую пропускную способность: у DeepSeek и Moonshot наблюдались результаты в диапазоне 50 — 100 токенов в секунду. Это преимущество по скорости делает Nemotron 3 Ultra привлекательной для систем с большим потоком запросов и требующих низкой задержки.
В сравнительной шкале Nemotron 3 Ultra опережает другие открытые решения из США: Gemma 4 31B получила 39 баллов, Nemotron 3 Super — 36, а gpt-oss-120b — 33. При этом она уступает лучшим китайским открытым моделям и некоторым закрытым системам: Kimi K2.6 набирает 54 балла, а ведущая закрытая модель Opus 4.8 — 61 балл. То есть по верхней планке «чистого интеллекта» и по отдельным показателям производительности преимущество пока остаётся у конкурентов.
NVIDIA заявляет о выпуске Nemotron 3 Ultra 4 июня на платформах Hugging Face и OpenRouter, а также на других площадках, что упростит доступ исследователям и разработчикам. Появление модели в открытом доступе позволит интеграторам и инженерам тестировать её в собственных стэках, сравнивать с альтернативами в реальных нагрузках и оценивать баланс между скоростью и качеством ответов. В то же время рейтинги показывают, что дальнейшие улучшения в области качества генерации и верхней планки производительности будут критически важны для того, чтобы догнать лидеров из Китая и лучшие закрытые решения.
Источники
Ответы (0)
Пока нет ответов в этой теме.