Entendiendo la pandemia

MÉTODOS Y DATOS

¿Cuál es el ritmo de la pandemia?

Ajuste y tiempo de duplicación

Para estimar el tiempo de duplicación hicimos un ajuste robusto (es decir, resistente a valores atípicos) de un modelo lineal al logaritmo de los datos. Específicamente, utilizamos el siguiente procedimiento:

  1. Definimos una ventana temporal para cada tramo de la curva (de tres semanas de largo en el caso de los tres primeros tramos; una semana en el caso del último tramo).
  2. Utilizando los datos de día y número de casos que corresponden a cada ventana temporal, ajustamos el modelo $$\ln(N) \sim \alpha + \beta(t - t_{prom})$$ donde $N$ es el número total de casos confirmados, $t$ es el tiempo en días desde el primer caso en la ventana considerada y $t_{prom}$ es el tiempo medio en la ventana considerada. Utilizamos la función rlm de la librería MASS en lenguaje R. Todos los puntos de la ventana entran en el cálculo con el mismo peso.
  3. Dado el valor obtenido para beta, calculamos el tiempo de duplicación como $$T_d = \ln(2)/\beta$$

Simplificaciones consideradas

Utilizamos un modelo de tiempo continuo (en contraposición a un modelo de tiempo discreto, donde la evolución se da en pasos). Dados los tramos rectos que se observan en el gráfico de casos totales en escala semilog, asumimos que en dichos tramos la evolución del número total de casos está aproximadamente descrita por una función exponencial del tiempo con una dinámica subyacente del tipo $dN/dt = \beta N$. Elegimos esta aproximación por simplicidad. Otros modelos pueden considerar una dinámica de tipo logístico $dN/dt = \beta ((K-N)/K)N$ que incluye límites al crecimiento dados naturalmente por un tamaño finito de población, etc. Modelos aún más complejos distinguen diversos estadíos de la enfermedad al considerar transiciones entre personas susceptibles, infectadas, recuperadas, fallecidas y otras condiciones (por ejemplo del tipo SIR, SIRD, SEIR, MSEIR, etc.).


¿Cómo evoluciona mi provincia?

Ajuste y tiempo de duplicación

Para estimar el tiempo de duplicación de los últimos datos de cada provincia hicimos un ajuste robusto (es decir, resistente a valores atípicos) de un modelo lineal al logaritmo de los datos correspondientes. Específicamente, utilizamos el siguiente procedimiento:

  1. Definimos una ventana temporal que abarca los datos de las últimas dos semanas.
  2. Para cada provincia, utilizamos los datos de día y número de casos que corresponden a la ventana temporal y ajustamos el modelo $$\ln(N) \sim \alpha + \beta(t - t_{prom})$$ donde $N$ es el número total de casos confirmados, $t$ es el tiempo en días desde el primer caso en la ventana considerada y $t_{prom}$ es el tiempo medio en la ventana considerada. Utilizamos la función rlm de la librería MASS en lenguaje R. Todos los puntos de la ventana entran en el cálculo con el mismo peso.
  3. Dado el valor obtenido para beta, calculamos el tiempo de duplicación como $$T_d = \ln(2)/\beta$$

Simplificaciones consideradas

Utilizamos un modelo de tiempo continuo (en contraposición a un modelo de tiempo discreto, donde la evolución se da en pasos). Dados los tramos rectos que se observan en el gráfico de casos totales en escala semilog, asumimos que en dichos tramos la evolución del número total de casos está aproximadamente descripta por una función exponencial del tiempo con una dinámica subyacente del tipo $dN/dt = \beta N$. Elegimos esta aproximación por simplicidad. Otros modelos pueden considerar una dinámica de tipo logístico $dN/dt = \beta ((K-N)/K) N$ que incluye límites al crecimiento dados naturalmente por un tamaño finito de población, etc. Modelos aún más complejos distinguen diversos estadíos de la enfermedad al considerar transiciones entre personas susceptibles, infectadas, recuperadas, fallecidas y otras condiciones (por ejemplo del tipo SIR, SIRD, SEIR, MSEIR, etc.).


¿En qué países murieron más personas por COVID-19?

Correlación entre número de fallecidos y tamaño de la población

Tomamos todos los países con más de 50 fallecimientos por COVID-19 y más de 100.000 habitantes. Calculamos una regresión lineal robusta (es decir insensible a datos atípicos) entre el logaritmo del número de fallecimientos totales de dichos países (al 31 de julio de 2020) y el logaritmo del tamaño de sus poblaciones. Utilizamos la función lmrob de la librería robustbase en R. La pendiente obtenida es 0.75 $\pm$ 0.11 (valor central $\pm$ error estándar; intervalo de confianza del 95%: 0.55-0.96; $p=4 \times 10^{-11}$).

Maronna, R. A., Martin, R. D., Yohai, V. J., & Salibián-Barrera, M. (2019). Robust statistics: theory and methods (with R). John Wiley & Sons.


¿Qué nos dice el número de fallecimientos?

Estimación del retraso entre las curvas

Definimos el retraso entre las curvas de casos totales y de fallecimientos como el número de días que hay que desplazar la curva de casos totales para que sea máximamente similar a la de fallecimientos. Específicamente:

  1. Para cada país definimos una ventana temporal de duración $D$ entre 80 y 130 días (dependiendo del país) comenzando el 1 de marzo tal que el primer pico de casos totales se encuentre dentro de la ventana.
  2. En dicha ventana tomamos la serie temporal de casos totales confirmados $C_n$ y la serie temporal del número total de fallecimientos $F_n$. Normalizamos cada serie dividiendo por su valor máximo dentro de la ventana.
  3. Calculamos el error cuadrático medio entre ellas: $$\mathit{ECM}(0) = \frac{1}{D}\sum_{n=1}^D(C_n-F_n)^2$$ Este valor corresponde a considerar un retraso de cero días.
  4. Repetimos lo anterior desplazando sucesivamente la serie de casos totales un día, dos días, tres días, etc., para obtener el error cuadrático medio en función del desplazamiento de $n$ días: $\mathit{ECM}(n)$.
  5. El retraso reportado en el texto para cada país es el que hace mínimo su error cuadrático medio.
  6. En el caso de Argentina, las curvas son crecientes (sin pico) hasta el momento del cálculo; debido a eso elegimos utilizar el logaritmo de los datos en vez de los datos originales.

¿Cómo se compara COVID-19 con otras enfermedades contagiosas?

Digitalización

Digitalizamos el gráfico 2 del artículo “The coronavirus pandemic in five powerful charts” (ver Fuente a continuación) con el programa g3data en Linux.

Fuente

Nature 579, 482-483 (2020).
doi: 10.1038/d41586-020-00758-2


¿Cómo entender la evolución de la pandemia en el mundo?

Las curvas de “comportamientos elementales” son idealizaciones que dibujamos directamente sobre el gráfico (es decir, sin utilizar un modelo matemático) para clasificar curvas reales en términos de conceptos simplificados más elementales. La relación entre dichos conceptos y sus potenciales modelos matemáticos es la siguiente:

  1. Diagonal principal: crecimiento exponencial con tiempo de duplicación de aproximadamente 2-3 días. Modelo simplificado: $\frac{dN}{dt} = \beta_1N$, donde $N$ es el número total de casos. El tiempo de duplicación es $T_d = \ln(2)/\beta_1$. Ver notas metodológicas de la historia “¿Cuál es el ritmo de la pandemia?”. En el gráfico de casos nuevos diarios vs. casos totales (con escala logarítmica en ambos ejes) se ve como un tramo recto diagonal.

  2. Diagonal paralela: crecimiento exponencial con tiempo de duplicación mayor. Modelo simplificado: $\frac{dN}{dt} = \beta_2N$, con $\beta_2<\beta_1$. En el gráfico de casos nuevos diarios vs. casos totales (con escala logarítmica en ambos ejes) se ve como un tramo recto diagonal por debajo de la diagonal principal.

  3. Control: el número de casos nuevos diarios se acerca a cero. Modelo simplificado: $\frac{dN}{dt} \sim 0$. En el gráfico de casos nuevos diarios vs. casos totales (con escala logarítmica en ambos ejes) se ve como un tramo recto que se hace vertical hacia abajo.

  4. Constante: el número de casos nuevos diarios tiene un valor constante. Modelo simplificado: $\frac{dN}{dt} = c$, donde $c$ es una constante positiva. En el gráfico de casos nuevos diarios vs. casos totales (con escala logarítmica en ambos ejes) se ve como un tramo recto horizontal.

Para modelar las transiciones entre estos comportamientos elementales (como por ejemplo pasar de la diagonal principal a crecimiento constante) o sus composiciones (por ejemplo pensar un rebrote como diagonal + control + diagonal) deberían considerarse expresiones matemáticas más complicadas.


¿Cómo sabemos si el plasma funciona para tratar COVID-19?

Fuente

Recomendaciones condicionales para el abordaje terapéutico de COVID-19 - Versión 3.0 (Ministerio de Salud de la Nación)