01 Jul 2020 Evolución de la COVID-19 en Europa: una alternativa en la representación de las cifras
Seguimos con la serie iniciada con el post SIG y epidemiología en tiempos del COVID-19. En esta entrada queremos mostrar diferentes formas de representar los datos sobre la evolución de la COVID-19 en Europa.
Los datos pueden representarse en un mapa de formas distintas dependiendo de lo que se quiera explicar o mostrar. El modo en que tratamos y representamos nuestros datos nos permite explicar e interpretar una misma variable de formas muy diferentes.
El objetivo de esta entrada no es tanto analizar la evolución de la enfermedad, como mostrar un enfoque diferente en la representación de los datos más allá de la clásica evolución temporal por fechas.
Representación de la evolución de la COVID-19 en Europa por cifras totales
A lo largo de los últimos meses hemos visto mapas que mostraban la evolución temporal de la pandemia de COVID-19 en diferentes ámbitos territoriales. La gran mayoría de estos mapas muestran los datos de fecha más reciente o también series temporales que muestran la evolución de la pandemia.
El siguiente mapa muestra la evolución del número de fallecidos acumulados en Europa cada cinco días desde el 15 de febrero, fecha en la que se registró la primera defunción por COVID-19.
Para realizar este mapa se han utilizado los datos facilitados por el Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE). Se encuentran disponibles en el repositorio https://github.com/CSSEGISandData/COVID-19. Los datos recogen diariamente los casos de contagios, fallecimientos y recuperados registrados para todos los países del mundo.
El tipo de representación del mapa es útil para ver en que países se ha producido una mayor mortalidad, pero presenta dos problemas si queremos comparar la evolución de la pandemia entre países:
- Al representar valores absolutos no se tienen en cuenta la proporción de fallecidos respecto a la población del país por lo cual el impacto de la pandemia en pequeños estados queda minimizado.
- En cada país la pandemia se inició en diferentes fechas y por tanto no están en el mismo punto de la pandemia. Un claro ejemplo de lo que hablamos es Italia, primer país de Europa donde se declaró la pandemia y donde por tanto están en un estadio más avanzado en la evolución de esta.
Representación de la evolución de la COVID-19 en Europa por ratio
Para solucionar el primer problema el método más frecuente es representar el número de casos (ya sea contagiados o fallecidos) por cada 100.000 habitantes. Esto se calcula multiplicando el número de casos por 100.000 y dividiendo el resultado por la población total del país.
En el mapa anterior se pueden observar algunas diferencias importantes en la evolución del número de fallecidos. Un caso ejemplar es el de Bélgica que tiene la mayor mortalidad de Europa en relación a su población total. Otro ejemplo es el de España que, si bien a partir del mes de abril es el tercer o cuarto país en número total de fallecidos, es tras Bélgica el país con una mayor ratio por 100.000 habitantes. Mención aparte merecen otros países como San Marino y Andorra que no pueden apreciarse a la escala del mapa pero con una alta mortalidad relativa. Eso sí al ser países con un población muy pequeña (muy inferior a 100.000 habitantes) cualquier fallecimiento aumenta considerablemente la ratio.
Así pues, vemos que representar los fallecimientos por 100.000 habitantes nos sirve para precisar el impacto de la enfermedad en cada país. Sin embargo, si queremos compararlo con otros países tenemos el problema de que en cada país se ha declarado la pandemia en fechas diferentes y por tanto se encuentran en un punto diferente en la evolución de esta. El hecho de que un país tenga una ratio más elevada en una fecha determinada puede indicar simplemente que la pandemia se inició antes. En otras palabras, nos interesa poder comparar la mortalidad entre países en el mismo punto de pandemia, que no en la misma fecha.
Representación de la evolución de la COVID-19 en Europa por día de pandemia
Teniendo en cuenta que la pandemia se ha iniciado en fechas diferente en cada país, una forma de poder compararlos sería representarlos por día de pandemia. Este tipo de representación nos permite comparar los contagios o fallecimientos de forma más precisa. En cierto modo, unificamos el día inicial de la pandemia. Así pues el día 1 de pandemia aunque corresponde a una fecha diferente para cada país, nos permite marcar un punto inicial común a todos y obtener una comparación de todos los países en un mismo punto en la evolución de la pandemia,
Como determinar el inicio de la pandemia
La primera cuestión que se plantea es como podemos determinar el primer día de pandemia. Muchas estadísticas analizan la evolución indicando como primer día el momento en que se registran un determinado número de contagios. Como somos profanos en temas epidemiológicos y como el objetivo es simplemente mostrar otro enfoque en la representación de datos, hemos considerado como día 1 el primer caso de fallecimiento por COVID-19 registrado en cada país.
Para este ejemplo hemos trabajado con las cifras de fallecimientos acumulados. Se trata de una tabla en la que cada columna representa una fecha en la cual figura la cifra de fallecidos hasta ese día para cada país. Por tanto la primera tarea será añadir a esta tabla una nueva columna para cada día de pandemia comenzando por la correspondiente al dia 1. En esta primera columna se añadirá para cada país el número total de fallecidos el primer día que se tienen registros de fallecimientos y que será una fecha diferente en cada caso. A partir de aquí se añadirá de forma secuencial una columna en la que se añadirá la cifra correspondiente al día siguiente y así sucesivamente.
Programar una rutina en Python
Para realizar este proceso se ha programado una rutina en Python. En primer lugar crea tantas columnas como días de pandemia queramos representar. En este ejemplo se ha preparado para crear columnas para 100 días. Seguidamente la rutina busca para cada país la primera columna de fecha donde aparece una valor igual o mayor de 0 y añade esa cifra a la columna Dia 1. A partir de aquí va añadiendo los valores de las siguientes columnas a las de los días sucesivos.
En el caso que queramos considerar como día 1 de pandemia otra cifra de fallecimientos o contagios simplemente cambiaremos el valor ‘1’ en el apartado casos_inici_pandemia. Si quisiéramos representar los contagios en lugar de los fallecimientos, simplemente indicaremos el nombre de la tabla que contiene este dato y el número de casos registrados a partir de los cuales se considera que se ha declarado la pandemia en un país.
La siguiente imagen muestra la tabla resultante una vez ejecutado el script.
En la tabla podemos ver las columnas con el total acumulado de fallecidos por fecha así como las columnas que contienen la cifra de fallecimientos hasta un determinado día de pandemia. Se observa que en algunas columnas hay celdas con valores nulos. Esto significa que un país no ha llegado a un determinado día de pandemia y por tanto no hay datos. Conforme avancemos en la tabla por día de pandemia aparecerán lógicamente más países con valores nulos.
Evolución en cifras absolutas y día de pandemia
Una vez tenemos los datos de fallecimientos acumulados por día de pandemia, podemos hacer una representación por cifras absolutas tal como habíamos hecho con la representación por fechas.
El mapa muestra la evolución de los fallecidos cada 5 días, ya que de forma diaria apenas se apreciarían cambios.
Con este tipo de representación vemos algunas diferencias respecto a la representación por fechas. De entrada, para España se situaría a la cabeza de Europa en número de fallecidos, al menos durante las primeras semanas. Por el contrario, a medida que los países van avanzando en la evolución de la pandemia vemos cambios en la tendencia y países como sería el Reino Unido pasan a encabezar el ranking de mortalidad.
Conforme avanza la secuencia temporal van apareciendo países en gris que corresponden a aquellos casos en los que no se tiene datos ya que no han llegado todavía a ese día de pandemia.
Evolución por ratio y día de pandemia
Para poder comparar mejor la evolución por países, también hemos calculado la ratio por 100.000 habitantes y día de pandemia.
Esta representación no solo muestra el impacto de la COVID-19 ponderado por la población de cada país sino que lo hace en el mismo punto evolutivo de la enfermedad.
De esta manera observamos que países como Bélgica aparece desde el primer momento como uno de los países con una mayor mortalidad en Europa. Esto no sucedía en el mapa por fechas. La razón no es otra que aunque se trata de un país donde el coronavirus tardó en llegar, lo hizo con gran fuerza. Esto es patente también en países como el Reino Unido y, en menor medida, Suecia y Suiza.
Por otro lado, esta representación nos permite ver en el mapa en que países ha llegado más tarde la pandemia. Se trata de aquellos para los que no hay datos y por tanto aparecen en gris. En el mapa podemos ver que son Letonia y Eslovaquia para los cuales no hay datos más allá del día 55. Esto significa que el 27 de mayo estaban en el día 55 desde que registraron el primer fallecimiento por COVID-19, es decir, 40 días más tarde que Italia.
Consideraciones finales
Hemos visto que representar la evolución de la COVID-19 en Europa por días desde el inicio de la pandemia en lugar de por fechas puede resultar interesante para ver ciertas tendencias que de otra forma resultarían menos visibles. Este tipo de representación resulta especiamente útil para ver la evolución de un fenómeno que se ha iniciado en fechas diferentes para cada caso.
Sin embargo presenta el problema de que cuanto más cercana sea la fecha, mayor será el número de países para los que no tenemos datos. Esto se debe, como se ha indicado, a que dichos países, no han llegado a un determinado día de pandemia.
Los datos utilizados para los mapas son del 27 de mayo. En esta fecha tan solo Italia había llegado al día 95 de pandemia. Por tanto no tiene ningún país con que compararse ya que el resto están, en el mejor de los casos, en el día 90. Para obtener una visión más completa de la situación de Europa en el día 95 de pandemia debemos esperar algunas semanas. Si actualizásemos el mapa con los datos a 30 de junio, veríamos practicamente completado el mapa, aunque se repetiría el problema a medida que nos acercamos a la fecha actual.
Por tanto y como conclusión final hay que destacar que la representación por día de pandemia tiene un carácter retroactivo. Nos permite ver la evolución en fechas más alejadas, pero no sería del todo útil conforme nos acercamos a la fecha actual. Se trata de una representación interesante para comparar tendencias entre países pero que en ningún caso sustituye a la representación clásica por fechas.