El captcha (acrónimo de una expresión inglesa que significa “test de Turing completamente automático y público para diferenciar ordenadores de humanos”), es un programa de secuencias textuales cuya función es proteger contra bots al generar y calificar pruebas que los humanos puedan aprobar, pero los programas de computadora actuales no pueden, pues el objetivo es hacer que el usuario reconozca una serie de números y letras, algo hasta ahora imposible para una máquina. Éste fue diseñado por el guatemalteco Luis Von Ahn, que en aquel entonces tenía sólo 21 años y que junto con Severin Hacker creara también el sitio de aprendizaje de idiomas en la red conocido como Duolingo.
Hubo, en algún momento de la historia de estas “pruebas de acceso”, la intención de crear obra artística a partir de las palabras aleatorias que van apareciendo en las pruebas; es decir se creaban dibujos a partir de aquellas palabras, los resultados, evidentemente, eran estrambóticos. También, no faltó quien trató de crear textos con espíritu literario a partir de los captchas, si bien no se trascribían las palabras una tras otra, sí servían de excusa para despertar la imaginación. Y por ahí también quienes imitaban los patrones que resultaban de los distintos tamaños de las letras y los traducían en sus pinturas. Ninguna de estas formas de creación basadas en el captcha trascendió realmente.
El captcha ha sido considerado un sistema de seguridad infalible, sin embargo, esta semana se dio a conocer una reciente investigación cofinanciada por China y Reino Unido, en donde queda demostrado que variantes de captcha, han quedado obsoletas. El estudio describe cómo un sistema de Inteligencia Artificial está siendo capaz de atacar algunas de las webs más populares del mundo como Wikipedia, Microsoft o eBay, gracias a la capacidad de resolver con mayor facilidad los captchas de texto que utilizan muchas de ellas.
Muchos de los sistemas de reconocimiento artificial de los captcha funcionan a partir de pruebas reales ya resueltas por humanos y los sistemas de ataque requerían la recolección y etiquetado de millones de captcha, en cambio, el nuevo ataque que parte de la tecnología machine learning, reduce considerablemente la necesidad de intervención humana, pues su modelo se basa en un sistema llamado Generative Adversarial Network (GAN), programado tanto con una red de creación de ejemplos artificiales, como con la capacidad de reconocer entre estos y los ejemplos reales.
El autor de este interesante estudio es Zheng Wang, investigador de la Universidad de Lancaster de Reino Unido, quien asegura que “si consideramos que a un humano reconocer un captcha le lleva unos treinta segundos, calculamos que los ataques desarrollados anteriormente necesitarían de unos doce meses de trabajo para recoger todos los datos previos, mientras que el nuestro solo requiere de y unas cuatro horas”, este importante ahorro de tiempo logrado por la inteligencia artificial permitirá romper estas barreras con mayor eficiencia. Ahora el objetivo de las empresas de protección a los sitios web tiene más que ver con entender las amenazas y buscar nuevas barreras, considerando que la principal es que los cibercriminales utilicen los servicios.