Descifrar la escritura de algunas personas puede ser complicado, pero interpretar caracteres cuneiformes en tablillas de 3.000 años de antigüedad representa un reto aún mayor.

Inteligencia artificial permite copiar con precisión caracteres cuneiformes de tablillas antiguas

ProtoSnap: Dada una imagen objetivo de un signo cuneiforme y un prototipo correspondiente, se alinea el esqueleto con la imagen objetivo («ajustando» el prototipo en su lugar). Crédito: TAU/British Museum Digital Collections.

El cuneiforme, junto con los jeroglíficos egipcios, es una de las formas de escritura más antiguas del mundo, con más de 1.000 caracteres únicos. Su apariencia varía con el tiempo, la geografía y los escribas, lo que dificulta su interpretación.

Ahora, investigadores de la Universidad de Cornell y la Universidad de Tel Aviv (TAU) han desarrollado un método llamado ProtoSnap capaz de alinear un prototipo de carácter con su variante específica en la tablilla. Este avance permite copiar con precisión cualquier carácter y reproducir tablillas completas.

«En el mundo antiguo, la variabilidad en la forma de los caracteres es enorme», explicó Hadar Averbuch-Elor, profesora asistente de informática en Cornell Tech y en la Facultad de Ciencias de la Computación e Información Ann S. Bowers de Cornell, quien lideró la investigación. «Incluso un mismo carácter cambia de apariencia con el tiempo, lo que hace muy difícil su desciframiento automático».

Miles de tablillas por descifrar

Rachel Mikulinsky, estudiante de maestría en la TAU y coautora del estudio, presentará la investigación en abril en la Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR). Este desarrollo es especialmente relevante, ya que se estima que existen alrededor de 500.000 tablillas cuneiformes en museos, pero solo una fracción ha sido traducida y publicada.

Resultados de muestra: alineación de los prototipos (primera fila) con las imágenes cuneiformes objetivo (segunda fila). Los resultados se ilustran tanto después de la alineación global (tercera fila) como tras el refinamiento (fila inferior). Crédito: TAU.

Para abordar este desafío, el equipo utilizó un modelo de difusión, un tipo de IA generativa aplicada a tareas de visión por computadora, como la generación de imágenes. Con esta técnica, calcularon la similitud entre los píxeles de una imagen de un carácter en la tablilla y su prototipo general. Posteriormente, alinearon ambas versiones y ajustaron el modelo para coincidir con los trazos reales del carácter.

Los caracteres ajustados también pueden entrenar modelos de IA para el reconocimiento óptico de caracteres (OCR), lo que permite convertir imágenes de tablillas en texto digital legible. Al utilizar estos datos, los modelos han demostrado una mejora significativa en el reconocimiento de caracteres cuneiformes, incluso aquellos raros o con variaciones notables.

Volumen de similitud en 4D para encontrar correspondencias. Crédito: TAU.

Esta tecnología no solo agiliza la copia de tablillas, ahorrando incontables horas a los expertos, sino que también facilita la comparación a gran escala de caracteres en distintas épocas, ciudades y escribas.

«Nuestro objetivo es aumentar exponencialmente la cantidad de fuentes antiguas disponibles. Esto permitirá, por primera vez, el análisis de grandes volúmenes de datos, generando nuevos conocimientos sobre la religión, economía, sociedad y leyes de las civilizaciones antiguas», concluyó Yoram Cohen, profesor de arqueología en la TAU y coautor del estudio.

Fuente: Cornell. Edición: MP.

Sin comentarios
Etiquetas: , , , , , ,

¿Te gustó lo que acabas de leer? ¡Compártelo!

Facebook Reddit Twitter WhatsApp Pinterest Email

Artículos Relacionados

 0 comentarios
Sin comentarios aún. ¡Sé el primero en dejar uno!
Dejar un comentario