¿Predijo Google el Coronavirus?

En plena pandemia mundial por Covid-19, una de las discusiones más habituales en casi todos los países es si los diferentes gobiernos tomaron las medidas necesarias para paliar los efectos del virus. Aunque en nuestro blog solemos hablar de otras muchas cosas, y en especial de WordPress, hoy queremos hacer una entrada algo especial, concretamente utilizaremos nuestros conocimientos relacionados con la analítica de búsquedas de Google para detectar si habían patrones que pudieron avanzar la detección del Covid19 antes.

No es un estudio riguroso, y de hecho hay otras personas que seguro que os pueden detallar mucho más que nosotros, pero nos ha resultado estimulante analizarlo en estos días de cuarentena en los que la cabeza le da vueltas a las cosas.

Tampoco es algo novedoso, ya hay estudios que afirman que gracias a los búsquedas que realizan los usuarios en Google de diferentes síntomas, cada año se puede ver la afectación de la gripe. Gracias a la geolocalización de los resultados y búsquedas, podemos poner zoom en zonas concretas.

El «método»

Básicamente, lo que haremos será utilizar las estadísticas de volumen de búsquedas que realizan los usuarios a través de Google de una serie de parámetros concretos en un espacio temporal concreto. Hasta aquí ningún secreto (ni novedoso).

Síntomas

Podríamos hacer una gráfica sobre búsquedas de «coronavirus» que sería super interesante (y lo haremos) pero lo compararemos con síntomas. En este caso, vamos a seguir unos sintomas concretos. La hipótesis es saber si las búsquedas de estos síntomas empezaron antes o después de detectarse el coronavirus, y por tanto, que ya había personas contagiadas (sin saberlo).

¿Pero que síntomas vamos a escoger? Pues seguiremos el patrón de la app Stop Covid de la Generalitat de Catalunya, una de las primeras que surgieron a tal efecto, y que después de introducir tu identificación médica, te hace un pequeño test para saber si tienes síntomas y debes pasar a ser analizado con más profundidad.

Estos cinco síntomas del formulario de la app son:

  1. fiebre
  2. tos continuada
  3. tos persistente
  4. dificultad respiratoria
  5. malestar general

Fechas

Necesitamos otra variable, y es temporal. Si queremos analizar si habían personas buscando información de sus síntomas antes de que las autoridades sanitarias actuaran, debemos marcar una fina linea temporal que nos separe que consideramos «antes» o «predicción».

Establecer esta línea temporal es complejo, pero si que hay algunas fechas que podrían ayudarnos en este sentido:

  1. 31/01 – Primer caso de covid en España. Por parte de un turista.
  2. 26/02 – Primer contagio «local».
  3. 02/04 – 100 primeros contagios.
  4. 12/04 – Confinamiento Igualada.
  5. 13/04 – 100 primeros decesos.
  6. 15/04 – Declaración estado de alarma.

Las fechas, con muchos más detalles, se pueden ver en esta entrada de la Wikipedia que hace una buena cronología de la pandemia en el Estado español, pero ciertamente tenemos un problema con estas fechas, y es que pasan meses entre los primeros casos y la declaración de estado de alarma. ¿Podemos utilizar estas fechas?

No es aquí el lugar de abrir el debate sobre si se podía haber hecho algo antes, y si las medidas llegaron tarde. Aunque parece evidente que si, pero es mi opinión, que puede ser más o menos compartida. Simplemente escogemos fechas para cruzarlas con los síntomas que hemos apuntado antes.

Google y sus búsquedas

Igual que en los estudios y artículos que se realizan para ver si las búsquedas que hacen los usuarios en Google de diferentes síntomas pueden advertir de enfermedades como la gripe semanas antes de que sean epidemia, vamos a analizar los 5 síntomas.

He decidido escoger desde 1 de enero, para así tener una foto más clara. Me gustaría analizar uno a uno, pero antes, tenemos que hacer un pequeño paso atrás.

Coronavirus

Para ser más analítico y empírico, debemos dar un paso atrás, porque si analizamos los síntomas sin ningún contexto pueden llevarnos a equivocaciones. Básicamente, debemos buscar algún elemento que nos ayude a no contaminar la gráfica. Me explico:

Debemos buscar elementos que nos ayuden a separar la búsqueda de «fiebre» (por ejemplo) porque realmente la tienes, y por tanto es un dato a tener en cuenta, y las búsquedas de fiebre como resultado de buscar por ti mismo esa palabra en Google porque sabes que un síntoma del Coronavirus, y por tanto es causa efecto de la primera, y no al revés.

Por ello, pienso que es interesante también tener en cuenta el gráfico de búsquedas de «coronavirus». Escojo «coronavirus» y no «covid 19» a posta, ya que siempre se debe optar por términos coloquiales cuando hablamos de búsquedas en Google.

El gráfico:

Aquí podemos observar algunos picos:

  1. 31/01
  2. 25/02
  3. 12/03
  4. 14/03

Es curioso, porque justamente estas fechas coinciden (a veces con un día de margen) con las fechas «importantes» que hemos indicado más arriba.

Este gráfico también nos ayuda a una cosa, y es que podemos filtrar más las fechas. Si el «top» es el 14 de marzo, podemos analizar los síntomas hasta esa fecha. También a nivel visual nos ayudará, porque las crestas antes del estado de alarma se verán mejor.

Ahora si, vamos con los síntomas:

Fiebre

Aquí si que tenemos muchos más picos interesantes a detallar. Primero que tenemos un conjunto de varias crestas, que luego descienden para volver a subir. Vamos a verlas:

  • 18/01
  • 25/01
  • 01/02
  • 26/02
  • 12/03

En estas fechas si tienen algo de relevantes, y es que tanto el día 18 como el día 25 no había aún ningún caso de Covid en el Estado español. Las demás fechas si coinciden con nuestras «importante». Quizá también destaca la fecha del 12/03, que fue el día en que se declaró el confinamiento en Igualada, con las consecuencias mediáticas de la decisión, y el número de casos crecía, pero aún no se había declarado el  Estado de alarma.

En ese momento, y dado la curva que iba en aumento, está claro que la población ya empezaba a tener conciencia de los síntomas del Covid, porque coincide también con la curva de búsquedas para «coronavirus».

De aquí las dos fechas interesantes son justamente la del 18 y el 25 de enero. ¿Habían personas con síntomas de coronavirus sin que fueran detectadas? Si fuéramos un tabloide sensacionalista ya tendríamos titular, pero hay que ser mucho más concienzudos, y cabría ver si hay diferencia o no en esos datos con un mes de enero habitual.

Eso es lo que he comparado:

Como se puede observar, ya es habitual que las búsquedas por «fiebre» suelan subir alrededor de enero (flechas en el gráfico), seguramente por la gripe estacional habitual. Por tanto aunque relevante, tampoco puede ser algo determinante. Además, justo el pico del 2020 es quizá menos exagerado que otros años (hasta que se declara el estado de alarma y las búsquedas se disparan).

Tos

El siguiente síntoma es la tos. En la APP Stop Covid se utilizan las formulas «tos continuada» «tos persistente», lo he querido simplificar a «tos».

Aquí los datos que me parecen más relevantes, son justamente los históricos. Vamos con el gráfico:

Los datos son desde 2015, y vemos que todas las crestas son justamente alrededor de enero, pero más marcadas a finales de diciembre, quizá el periodo clave que estamos viendo respecto al coronavirus. Es curioso que justamente este 2020 es de toda la serie el que menos búsquedas tiene de «tos» en diciembre, pero luego, hay algo que no se produce en toda la serie, y es una especie de meseta, que dura concretamente del 29 de diciembre al 8 de febrero.

Aquí si que hay un comportamiento diferente: al contrario que otros años en que sube la tos en diciembre para empezar a bajar rápidamente en enero, este 2020 se mantuvo más estable, formando una meseta, y de hecho, no bajó. Esa bajada que hay en 2020 es del 18 de febrero, y aunque puede estar más o menos al mismo volumen que años anteriores, la «meseta» fue diferente.

En el término «tos» si que vemos que algo diferente pasaba. Al menos, si lo analizamos a posteriori.

Dificultad respiratoria

El siguiente síntoma es «dificultad respiratoria». Con esta he tenido algunos problemas metodológicos. He estado mirando términos búsquedas relacionados y realmente son muy bajas como para formar un perfil, y tampoco pienso que sea un término coloquial con el que buscar. El término «respirar» tampoco me parece adecuado, porque se relaciona mucho con temas de relajación, en cambio, he encontrado un término con suficientes búsquedas como para resultar interesante: «me cuesta respirar»:

En este caso no he tenido ni que poner flechas, a simple vista se puede ver, con datos de 2015 a abril de 2020 que no había una subida de búsquedas a principio de 2020 respecto a otros años.

Malestar general

Por último, pero no menos importante, el término «malestar general». En este caso he estado buscando términos relacionados «me encuentro mal» por ejemplo, y el volumen es bajo. También por «malestar general» el volumen no es muy alto, pero suficiente para el experimento de pacotilla que estamos haciendo.

Dentro gráfico:

De nuevo la serie histórica no nos proporciona muchos datos relevantes en este caso. Sigue la tendencia final en los últimos meses que la búsqueda «coronavirus», y lo que va de principio de año hasta la declaración de alarma tampoco es muy diferente a otros años.

Conclusiones

La primera de todas es que esta entrada de blog puede resultar estimulante, pero para nada nos puede proporcionar ninguna conclusión en términos médicos, políticos o estadísticos. Las flechas en los gráficos están puestas como chinchetas y se necesario un estudio más detallado que un artículo de blog de 1482 palabras y 1h 17m de redacción.

Dicho esto, parece evidente que el término «tos» si nos intuía que algo pasaba, pero por supuesto esto lo podemos saber a posteriori.

Otra conclusión es que Google puede ser una herramienta muy poderosa para analizar sentimientos y reacciones, así como miedos e interés. Todos los gráficos si que lo demuestran una y otra vez: Google ha servido a millones de personas para buscar información sobre el coronavirus.

Esta poderosa conclusión, si que abre una reflexión profunda sobre la falta de información útil y (que los ciudadanos consideran) veraz, que encuentra el ciudadano medio en los medios de comunicación habituales, porque estos gráficos demuestran una y otra vez, que muchas personas, un volumen significativo, acaban en Google buscando la información que ni fuentes oficiales ni medios de comunicación parecen darles, o como mínimo, buscan confirmar estas informaciones.

No soy experto y no puedo afirmas tajantemente si España ha realizado una gestión tardía o no, aunque intuyo, como todos, que si, pero si puedo afirmar que la gestión informativa no ha sido buena, y que hay serias dudas sobre la calidad de la información que se ha podido llevar a cabo. Tampoco es ninguna sorpresa, todos hemos visto con horror mensajes contradictorias constantes, poco claros en el mejor de los casos, y medidas que cambian en cuestión de horas, o que una vez publicadas en el BOE son diferentes a las anunciadas.

Por todo ello, Google continua siendo una fuente enorme de conocimiento, información y sistema de verificación para muchas personas, de ahí también la importancia y reflexión de como Google trata y posiciona contenidos médicos. Pero eso ya es otra historia.

Espero en todo caso que os haya gustado este pequeño estudio patillero, y os permita evadiros un poco de las cuarentenas y los momentos duros que estamos viviendo.

Divertimento

Una de las cosas que me gusta hacer de forma recurrente, es analizar con perspectiva diferentes términos de búsqueda, para ver el estado de ánimo general. Aquí os pongo algunos gráficos que sé os gustaran y llamarán la atención:

Esperanza

Crisis

Embarazada

Comprar casa

Salud

Invertir

Espero que os haya gustado, tenéis un formulario lamar de chulo para suscribiros y recibir las siguientes actualizaciones del blog!



Antoni

Persona de letras en un mundo de ciencias. Siempre buscando la perspectiva humanista de las cosas. Un día descubrí el SEO y ya no me pude desenganchar de él, para bien o para mal :)