Aivizor
Aivizor
EstilosCreacionesComunidad
Atrás
  1. Comunidad
  2. /
  3. Other AI

Archivistas recurren a ChatGPT y GPT-4 para transcribir manuscritos a gran escala

News
I
Inés Montoya

5/15/2026, 2:49:35 AM

Archivistas están usando modelos de lenguaje general como ChatGPT y GPT‑4 para leer y transcribir escrituras manuscritas que antes requerían paleografía o software especializado, acelerando el acceso a colecciones hasta ahora difíciles de explotar.

Investigadores y archivistas están empleando modelos generales de IA, entre ellos ChatGPT y GPT‑4, para transcribir manuscritos complejos con rapidez, permitiendo convertir en segundos páginas que antes exigían semanas de trabajo o especialistas en paleografía. Un ejemplo concreto: una investigadora que trabajaba con los diarios personales de bell hooks en el archivo de Berea College (Kentucky) fotografió páginas con letra muy enmarañada y las pasó a ChatGPT para poder leerlas, obteniendo resultados útiles.

news image

La utilización de modelos generales llega tras décadas de investigación en reconocimiento de escritura. Investigaciones sobre reconocimiento manuscrito datan de hace mucho tiempo; en los años 1980 Yann LeCun demostró avances al reconocer dígitos en entornos controlados, pero esos contextos eran mucho más restringidos que los fondos archivísticos variados que afrontan hoy los equipos de conservación y estudio.

El profesor Mark Humphries, de Wilfrid Laurier University, ha documentado las limitaciones y las posibilidades en proyectos a gran escala. Humphries digitalizó 10 millones de páginas de registros de pensiones de la Primera Guerra Mundial en Canadá y halló que la enorme variedad de escribientes impidió entrenar modelos específicos. Tras el lanzamiento de GPT‑4 en 2023 empezó a alimentar manuscritos al modelo; los resultados fueron toscos pero superiores a otras herramientas.

Él y su equipo evaluaron las capacidades durante dos años y publicaron sus hallazgos en mayo de 2025 en la revista Historical Methods, usando un corpus de 50 cartas, registros legales y entradas de diario en inglés de los siglos XVIII y XIX. Aunque los modelos generales no alcanzan lectura perfecta en todas las páginas, han alcanzado una utilidad práctica que permite transcribir y, crucialmente, indexar y buscar colecciones que permanecían funcionalmente ocultas. Esto amplía el acceso para investigadores, familiares y bibliotecas y podría acelerar proyectos de digitalización e investigación histórica, reduciendo la dependencia de paleógrafos y de software a medida.

A transcription software\u2019s computer interface, with digitized text displayed across from a historical handwritten document.

Fuentes

  1. IEEE Spectrum AI · 5/13/2026
0
0
0

Respuestas (0)

Aún no hay respuestas en este tema.

9:41