Borrar
Consulta la portada de El Norte de Castilla
Captura de la herramienta Google Flu.

El último arma de la epidemiología

Expertos en enfermedades infecciosas utilizan las búsquedas en Google y la Wikipedia para trazar la expansión de epidemias en tiempo real

ANTONIO VILLARREAL

Miércoles, 4 de junio 2014, 14:40

En 1854, el médico británico John Snow inauguró la epidemiología moderna al usar un método revolucionario para descubrir el origen de un brote de cólera: un mapa del centro de Londres. Señalando cada día el número de víctimas de la enfermedad que había en cada edificio llegó a una conclusión, el epicentro estaba en una fuente de agua que había en la calle Broad, por tanto el virus se estaba transmitiendo de ese modo. Era la primera vez que una epidemia se georreferenciaba.

Hoy, 160 años después, las enseñanzas de Snow han llegado a un nuevo paradigma en la era del Big Data. Cualquier búsqueda en Google o Wikipedia de términos como "Tamiflu", "gripe" o "Influenza" pone a los expertos de instituciones como el CDC (Centro de Control de Enfermedades) en alerta. Ya no siguen la enfermedad, sino la huella digital de la enfermedad, y parece que el resultado es prácticamente el mismo.

Un método

"Hemos creado un método de estimar la cantidad de enfermedades relacionadas con la influenza en la población americana, en cualquier época del año, analizando la cantidad de tráfico de internet en ciertos artículos de Wikipedia relacionados con la enfermedad", dicen en su estudio -publicado en abril por la revista PLoS- los investigadores David McIver y John Brownstein. "Este método es capaz de estimar con precisión el porcentaje de americanos con gripe en tiempo real, y es robusto en temporadas de influenza que son más severas de lo normal o en eventos que atraen la atención mediática, tales como la pandemia de H1N1 de 2009".

Estos dos investigadores de la Harvard Medical School registraron durante 294 semanas (de 2007 a 2013) las visitas a estas páginas de Wikipedia y alcanzaron unos resultados de prevalencia de la enfermedad que sólo se diferenciaban con los oficiales, del CDC, en un 0,27%

Resulta, además, ligeramente más fiable que Google y su herramienta Flu, los pioneros -comenzaron en 2008) en monitorizar datos de búsqueda y relacionarlos con pandemias, no sólo de gripe, sino también de dengue. Fueron también los primeros en recibir críticas, ya que en 2009, Google Flu no fue capaz de prevenir la pandemia de gripe, lo que obligó a retocar sus algoritmos.

Además de su investigación con Wikipedia y la gripe, Brownstein colaboró en otro estudio, publicado en American Journal of Tropical Higiene and Medicine, que empleó datos recogidos en medios digitales o Twitter durante los 100 primeros días de la epidemia de cólera -un viejo conocido de los epidemiólogos- en Haiti en 2010. Sorprendentemente, y pese a lo informal de las fuentes, el número de casos resultó finalmente muy parecido al que mostraban las estadísticas oficiales. Sin embargo, Brownstein junto con investigadores del MIT los obtuvieron dos semanas antes y con un coste muchísimo menor.

Carencias

Pero, como demostró el fiasco de Google Flu en 2009, emplear este enorme conjunto de datos en lugar de la tradicional recogida de encuestas y muestras no es la panacea. En un artículo de Science, los autores de Google Flu reconocieron haber sufrido la "arrogancia del Big Data", lo que definieron como la "asunción a menudo implícita de que el Big Data es un sustituto, en lugar de un suplemento, a la recolección tradicional y análisis de los datos", según apuntó David Lazer, de la Harvard Kennedy School y uno de los autores de la fallida herramienta.

Al igual que un gran potencial, este uso del Big Data presenta problemas. En primer lugar, empresas como Google no son transparentes a la hora de revelar sus métodos. Por ejemplo, qué términos de búsqueda emplean para monitorizar la gripe influenza. Por otro lado, y como señalaba hace unos meses Arnaud Chiolero, del Instituto de Medicina Social y Preventiva suizo, en la revista Epidemiology, tener un gran tamaño de muestras, como ocurre en el Big Data, "no es suficiente para tener una epidemiología creíble. La obsesión con el poder y la precisión de estudio", pensar que millones de búsquedas en Wikipedia son más fiables que un estudio con 50 pacientes, "puede haber emborronado asuntos fundamentales de validez que no se resuelven aumentando el tamaño de las muestras, por ejemplo, errores de muestreo, prejuicios de selección o confusión residual".

Publicidad

Publicidad

Publicidad

Publicidad

Esta funcionalidad es exclusiva para suscriptores.

Reporta un error en esta noticia

* Campos obligatorios

elnortedecastilla El último arma de la epidemiología

El último arma de la epidemiología