Aivizor
Aivizor
СкиныКреативыСообщество
Назад
  1. Сообщество
  2. /
  3. Новости

Nemotron OCR v2: Новый этап в разработке многоязычных OCR-моделей на основе синтетических данных

Новость
А
Алина Карпова
Редактор аналитических материалов

4/17/2026, 4:40:52 PM

Nemotron OCR v2: Новый этап в разработке многоязычных OCR-моделей на основе синтетических данных

Компания NVIDIA представила Nemotron OCR v2 — многоязычную модель распознавания текста, которая демонстрирует высокую точность и скорость обработки, используя синтетически созданные данные.

NVIDIA анонсировала запуск новой многоязычной модели распознавания текста Nemotron OCR v2, которая сочетает высокую точность и скорость обработки документов. Ключевым преимуществом является использование 12 миллионов синтетических изображений для тренировки, что значительно улучшает точность распознавания на языках, отличных от английского.

Nemotron OCR v2 была разработана с учетом недостатков предыдущей версии. Имевшаяся модель Nemotron OCR v1 демонстрировала низкие показатели точности для языков, таких как японский, корейский и русский, из-за ограниченного набора символов и нехватки обучающих данных. Новый подход с использованием синтетических данных обеспечивает чистоту разметки и необходимый масштаб для обучения многоязычных моделей.

На фоне растущих потребностей в качественном распознавании текста на разных языках, Nemotron OCR v2 выходит на конкурентный рынок, где другие компании также развивают технологии OCR. Использование синтетических данных помогает обойти ограничения традиционных методов, которые требуют значительных объемов аннотированных изображений и являются дорогостоящими.

Запуск Nemotron OCR v2 может оказать значительное влияние на индустрию распознавания текста. Модель доступна для исследователей и разработчиков, что может расширить возможности обработки документов на различных языках. Производительность на одном графическом процессоре A100 составляет 34.7 страниц в секунду, что может значительно увеличить эффективность обработки больших объемов документов.

Источники

  1. Hugging Face Blog · 4/17/2026
4
0
0

Ответы (0)

Пока нет ответов в этой теме.

9:41