Hace poco el IDST (Instituto de Ciencia de Datos de Tecnologías), que es una extensión en la tarea de investigación de la empresa China Grupo Alibaba, anunció el nacimiento de su primer sistema artificial de aprendizaje profundo. Se trata de una máquina desarrollada para la comprensión de lectura, la cual ha superado a los humanos en la prueba conocida como SQuAD (Stanford Question Answering Dataset), que consta de aproximadamente 100 mil pares de preguntas y respuestas basadas en 500 artículos de algunos sitios como la enciclopedia virtual Wikipedia.
El proyecto se ha desarrollado bajo la tutela del doctor Luo Si, y funciona a partir del aprovechamiento de la red de atención jerárquica que lee párrafos, oraciones y palabras para ubicar las frases precisas con posibles respuestas y con un valor comercial tan significativo que ya varias universidades como Carnegie Mellon, la Universidad de Stanford, el Instituto de Investigaciones Allen o empresas como Google, Facebook, IBM y Microsoft están interesados en utilizar la tecnología para numerosas aplicaciones como el servicio al cliente, tutoriales para museos o las respuestas en línea a consultas médicas; aprovechando la eficiencia de una manera sin precedentes.
El modelo de redes neuronales profundas, como se le conoce hasta ahora, generó una puntuación de 82,44 en Exact Match al proporcionar respuestas correctas a todas las preguntas que se le aplicaron, superando así la puntuación de un humano lector promedio que es de 82,30.
Al respecto, James Vincent publicó un interesante artículo en donde argumenta que las computadoras están diseñadas para procesar datos, pero, hablando de comprensión de lectura, hay una forma particular de información tan rica y densa que significa que está más allá de las capacidades de la inteligencia artificial más avanzada, con esto, Vincent pone en tela de juicio la validez de la prueba SQuAD asegurando que, en dicha prueba, no es necesario comprender el significado del texto ni de sus oraciones una a una, basta con conocer las palabras y buscar estructuras gramaticales aplicando programaciones previas para encontrar respuestas.
También, el lingüista Yoav Goldberg asegura que no hay que hacer a un lado el hecho de que SQuAD no se dedica a medir la comprensión lectora y se limita a ser una herramienta diseñada para orientar a los informáticos en el proceso de aprendizaje automático contrastando sus resultados con los arrojados por las pruebas hechas por humanos, para ello se obvian las preguntas de interpretación de modo que el sistema también es propenso a ser engañado.
Es importante resaltar que hasta el momento no existe la posibilidad de que las máquinas tengan un nivel de comprensión lectora que supere a un ser humano, por más que nos lo quieran vender como tal, de modo que, como ya lo expusimos en este mismo espacio más de una vez, la inteligencia artificial puede seguir siendo tomada como una herramienta que ayude en la eficacia de motores de búsqueda y de los sistemas inteligentes que faciliten la vida pero que falta mucho para que hablemos de comprensión de la lectura, ni qué decir de algo todavía más trascendente, el placer que deriva de dicha comprensión.