La inteligencia artificial podría obtener los archivos secretos del Vaticano

Ubicado dentro de las paredes del Vaticano, al lado de la Biblioteca Apostólica y justo al norte de la Capilla Sixtina, el VSA alberga 85 kilómetros lineales de estanterías que datan de más de 12 siglos. Incluye gemas como la bula papal que excomulgó a Martín Lutero y las súplicas de ayuda que María Reina de Escocia envió al Papa Sixto V antes de su ejecución. En tamaño y alcance, la colección es casi sin igual.

De esos 85 km, se escanearon y se pusieron a disposición en línea solo unas pocas páginas en milímetros. Incluso se han transcrito menos páginas al texto de la computadora y se han podido buscar. Si desea leer algo más, debe solicitar un acceso especial, viajar hasta Roma y recorrer cada página a mano. Pero un nuevo proyecto podría cambiar todo eso. Conocido como la proporción de códice, utiliza una combinación de software de inteligencia artificial y reconocimiento óptico de caracteres para explorar estos textos descuidados y hacer que sus transcripciones estén disponibles por primera vez. Si tiene éxito, la tecnología también podría abrir una cantidad incalculable de otros documentos en archivos históricos de todo el mundo.

Esta técnica se ha usado para escanear libros y otros documentos impresos durante años, pero no es adecuado para el material de los Archivos Secretos. Este programa tradicional divide las palabras en una serie de letras-imágenes buscando los espacios entre las letras. Luego compara cada imagen de letra con el banco de letras en su memoria. Después de decidir qué letra coincide mejor con la imagen, el software traduce la letra en código informático (ASCII) y, por lo tanto, hace que el texto se pueda buscar.


Este proceso, sin embargo, realmente solo funciona en texto tipográfico. Es pésimo para cualquier cosa escrita a mano, como la gran mayoría de los viejos documentos del Vaticano. Aquí hay un ejemplo de principios de los 1200, escrito en lo que se llama el guión minúsculo de Caroline, que parece una mezcla de caligrafía y cursiva: En relación de codice El principal problema en este ejemplo es la falta de espacio entre las letras o la denominada segmentación sucia. Este sistema no puede decir dónde se detiene una letra y comienza otra y, por lo tanto, no sabe cuántas letras hay. El resultado es un interbloqueo computacional, a veces denominado paradoja de Sayre: el software necesita segmentar una palabra en letras individuales antes de que pueda reconocerlas, pero en los textos escritos a mano con letras conectadas, el software necesita reconocer las letras para segmentarlas .


Algunos científicos informáticos han intentado evitar este problema para reconocer palabras completas en lugar de letras. Esto funciona bien tecnológicamente: a las computadoras no les importa si están analizando palabras o letras. Pero poner estos sistemas en funcionamiento es un oso, porque requieren enormes bancos de memoria. En lugar de unas pocas docenas de letras del alfabeto, estos sistemas tienen que reconocer imágenes de miles y miles de palabras comunes. Lo que significa que necesita un pelotón completo de eruditos con experiencia en latín medieval para revisar documentos antiguos y capturar imágenes de cada palabra...

Descubre las más recientes investigaciones de #JaimeMaussan en www.gaia.com/jaimemaussan

0 vistas

Copyright © 2018 Tercer Milenio Studios, todos los derechos reservados.

5250-2880   5250-2704

  • Negro del icono de YouTube
  • Negro Facebook Icono
  • Negro Twitter Icono

Explora Tercer Milenio

Redes Sociales

  • Icono social Twitter
  • Facebook Social Icon
  • YouTube Social  Icon
  • Icono social Instagram

Secciones