Más Información
Violencia en Tabasco no para: matan a empresario limonero y exregidor, Mario Peralta Jiménez; acababa de retirar dinero del banco
Por corrupción en Infonavit, FGR va por cártel inmobiliario de “Los Mañé” en Yucatán; hay al menos 178 afectados
Vecinos de colonia Cuarta Transformación logran que cambio de nombre sea sometido a consulta pública; hay amparos colectivos e individuales
Taddei anuncia ampliación presupuestal para elección judicial tras reunión con Sheinbaum; busca más de mil mdp
Denuncian supuesto reparto de juguetes y roscas por parte del CJNG en Aguascalientes; gobierno inicia investigación
Tráfico de armas de EU en México; estas son las demandas interpuestas contra armadoras desde el sexenio de AMLO
esteban.roman@eluniversal.com.mx
¿Cómo medir el silencio que —sabemos— golpea a los periodistas en distintas partes del país? La respuesta original se mantuvo a lo largo de la investigación: comparando homicidios (el más confiable de los registros delictivos de alto impacto) contra notas periodísticas sobre esos mismos delitos.
Es así que nos dimos cuenta de que lo más cercano a esa base era Google. Recaban datos desde 2004 y su tecnología de búsqueda permitiría filtrar el tipo de noticias que buscábamos de forma específica.
Pero Google News, nos dimos cuenta, no puede discriminar —sólo con un par de palabras llave— criterios que sólo un humano puede discernir, como la diferencia entre un homicidio doloso y uno culposo; o como una nota de seguimiento contra un breaking news.
Es entonces que se generó una combinación de keywords que fueron creadas a partir de ciclos de ensayo y error, hasta que la muestra resultante arrojó un resultado de 70% de notas útiles. Sin embargo, no podíamos fiarnos sólo de la supervisión humana. Siguió, por ello, un filtro de machine learning.