Parte 1 - Capítulo 1
Estudios comparados para la Alianza del Pacífico
Análisis de predicciones del Covid-19
en los Países de la Alianza del
Pacífico
1. Introducción
Al 15 de agosto de 2020 el número de casos positivos de Covid-19 registrados a
escala global reportaron 21.459.699 personas, mientras que la estadística de
decesos asociados fue de 765.718 individuos. Como resultado de lo anterior, la
tasa de letalidad por Covid-19 se estimó en 3,65%. Para los países de la Alianza del
Pacífico esa misma tasa se ubicó en el 5,74% y las cifras individuales arrojaron un
indicador correspondiente al 10,92% para México, 5,01% para Perú, 3,24% para
Colombia y 2,71% para Chile (OMS, 2020).
En este documento, se propone un estudio sobre la dinámica del Covid-19 para los
países que hacen parte de la Alianza del Pacífico, a través de los registros históricos
reportados por la Organización Mundial de la Salud en el periodo comprendido
entre enero 22 y 15 de agosto de 2020.
El objetivo central del documento estriba en el análisis de predicciones para la
determinación del Covid-19 utilizando como herramientas las funciones tipo
Gompertz y los modelos Arima. Con ese propósito, el estudio se divide en cinco
partes incluida esta breve presentación. En la segunda sección se expone un marco
teórico donde se señalan los aspectos técnicos de las funciones tipo Gompertz
y los modelos Arima de una forma introductoria. La tercera unidad exhibe de
manera sucinta la metodología de trabajo. La cuarta parte aborda el análisis de los
resultados y finalmente, la última sección se encarga de abordar algunas conclusiones y
recomendaciones.
2. Marco teórico
El modelo tipo Gompertz
Benjamín Gompertz (1825) propuso un modelo matemático que permite
evidenciar la dinámica de un fenómeno de naturaleza temporal caracterizado por
una tasa de lento crecimiento en su fase temprana (fase 1), y que posteriormente
adquiere mayor velocidad implicando la existencia de un máximo (fase 2) que, al
final, describe una etapa de estabilización a lo largo del periodo de estudio (fase 3).
El modelo gráfico se expresa en la figura 1.
Un modelo tipo Gompertz simple se describe en la ecuación 1:
En una función de este tipo, el parámetro a se asocia al número de casos
proyectados al final de la pandemia. La primera derivada de esta función con
respecto al tiempo t, permite obtener la curva de casos diarios y, mediante ella
es posible determinar las estimaciones que corresponden a proyecciones futuras.
El punto en que se maximiza esta función constituye el nivel más elevado de la
pandemia.
y (t) =
Otra forma de plantear el modelo es:
Yt = a –brt
En este caso b constituye una constante de desplazamiento horizontal, cuya
utilidad reside en establecer el tiempo estimado que tarda la curva en alcanzar
la estabilización. De otra parte, “r” se define como una tasa de crecimiento exponencial
estimada que
posibilita determinar una proxy de las tasas de contagio.
3. Los Modelos Arima
Las funciones Arima (Gujarati & Porter, 2010) hacen parte de la metodología
descrita por Box Jenkins, bajo la cual se propone un modelo general, se estiman
los coeficientes tentativos, se efectúa un testeo de diagnósticos bajo pruebas de
hipótesis y finalmente, se utiliza el modelo resultante para efectuar predicción.
Un modelo autorregresivo simple se caracteriza por expresar el comportamiento
de una variable dependiente Y_t como el producto de una versión retardada de
sí misma durante un periodo de tiempo (t-1) de forma que funge las veces de una
variable independiente. La relación se expresa en la ecuación 4.
Donde:
Y t = Variable dependiente
Y t-1= Variable independiente
Φ 0, Φ 1= Coeficiente autónomo y parámetro de impacto
correspondientemente.
εt= Término de error
En su forma general, el modelo contempla la existencia de rezagos distribuidos de
la variable dependiente asumiendo el rol de factores independientes. Lo anterior
se ilustra en la ecuación 5.
De otra parte, los modelos de promedios móviles constituyen estructuras bajo las cuales, a partir del comportamiento de la variable dependiente Y_t, actúan como el resultado de los errores de un modelo base que se retardan para dar una secuencia al proceso generador de datos. El arquetipo de un modelo de media móvil simple es el siguiente:
Donde:
Y t = Variable dependiente
ε t-1 = Variable independiente
θ 0 θ 1 = Coeficiente autónomo y parámetro de impacto
correspondientemente.
ν t= Término de error
En su versión general, el modelo contempla la existencia de rezagos distribuidos
del término de error efectuando el papel de variables exógenas. Esta idea se
representa en la ecuación 7.
Un modelo Arima (1, 0, 1) o Arma (1, 1) se obtiene de una combinación de secuencias autorregresivas y de medias móviles, por ejemplo un AR (1) de la ecuación 4 con un MA (1) de la ecuación 6:
Un modelo más general se expresaría de la siguiente forma:
Esta última ecuación se denomina modelo Arma (p, q) o Arima (p, 0, q). Donde p y q
simbolizan los esquemas autorregresivos y de media móvil correspondientemente.
Finalmente, si se examina el problema de la raíz unitaria y se decide aplicar un
nivel introductorio de primeras diferencias sobre la serie original, se obtiene un
modelo Arima (1,1,1) dado que el orden de integración I es de primer nivel.
Una forma más general sería la siguiente:
El anterior modelo se conoce como un Arima (p, i, q).
4. Metodología
El método de trabajo consistió en elaborar dos tipos de bases de datos para
los países que integran la Alianza del Pacífico. La primera muestra contiene
información correspondiente a los casos reportados de Covid-19 y las muertes
asociadas al mismo en el periodo comprendido entre el 22 de enero hasta el 15
de agosto de 2020, implicando un tamaño total de 207 observaciones diarias. La
segunda muestra fue estructurada a partir de la primera omitiendo las últimas
15 observaciones, generando como resultado una submuestra de 176 días
comprendidos entre enero 22 y julio 15 de 2020. El propósito de la submuestra
residió en la identificación de un proceso generador de datos estadísticos
que permitiera efectuar, en primera instancia, buenas predicciones dentro de
muestra, para que posteriormente pudiese ser utilizado en el pronóstico de las
31 observaciones eliminadas en el primer conjunto de cifras y posibilitara, de
esa forma, evaluar las proyecciones fuera de muestra con los datos reales. La
información fue obtenida directamente de los registros oficiales de la Organización
Mundial de la Salud (OMS) y, posteriormente, se organizaron en dos programas: Gretl, que fue
utilizado
para el desarrollo de la modelación econométrica basada
en esquemas tipo Arima, y Stata, para la construcción de funciones tipo Gompertz.
El análisis implicó además el enfrentamiento de dos tipos de modelos. Por un
lado, las funciones Arima que siguen la metodología convencional propuesta por
Box Jenkins, estructurada para las unidades de análisis y sus cambios en el tiempo,
incluyendo los escenarios de pronóstico dentro y fuera de muestra y, en segundo
término, el examen correspondiente de las funciones Gompertz.
La programación de las funciones tipo Gompertz es por defecto no lineal, pues
se trata de un modelo exponencial al que se le asignan valores iniciales en los
parámetros a, b y r, y después de procesos de iteración, se determinan los mejores
valores que ofrecen el mejor ajuste a los datos, y por consiguiente, son susceptibles
de predicción.
El proceso generador de datos para casos y decesos se programó de la siguiente
manera:
Donde Nl es el comando de programación no lineal, Y_t constituye los casos o decesos por país, α, β, y γ son parámetros fijos cuyos valores tentativos se ajustan por iteración. Con especial cuidado de β, y γ que constituyen, por definición, valores negativos, y t que es una variable de tendencia temporal. Los resultados de las estimaciones se presentan en los cuadros 4, 5, 6 y 7. Los dos primeros para muestras acotadas o restringidas y los dos últimos para muestras totales o irrestrictas.
5. Resultados
Los países que integran la Alianza del Pacífico subyacen dentro de las 20 naciones
con más contagios de Covid-19 a escala global. En la figura 2 se exhibe cómo el
virus asciende de forma multiplicativa, por lo que su evolución se encuentra
lejos de estabilización próxima. El número de infectados sobrepasa el umbral
de los 300 mil contagios, principalmente en Colombia, México y Perú. El caso
chileno, a pesar de situarse en el puesto número 18 del mundo, a finales de mayo
según la Universidad de Johns Hopkins, evidencia una dinámica más cercana al
aplanamiento de la curva.
Casos reportados para los Países de la Alianza del Pacífico
A continuación, se presenta la información correspondiente a los casos reportados
de Covid-19 y las muertes asociadas al mismo en el periodo comprendido entre
el 22 de enero y el 15 de agosto de 2020, implicando un tamaño total de 207
observaciones diarias.
Las cifras de letalidad del virus tienden a ascender conforme avanza el tiempo,
con la característica tácita de que las muertes se replican unas semanas después
de los contagios1
. Para mayo, Chile ocupaba el lugar número 35 a nivel mundial
después de Brasil, México, Perú y Colombia, según la Universidad de Johns Hopkins
las estimaciones de mediados de año continúan con la alta mortalidad.
Desde el examen estadístico, tanto los modelos Gompertz como las funciones
Arima poseen coeficientes, valores de probabilidad significativos y capacidad
explicativa y predictiva adecuadas, siendo en consecuencia prácticos para la
predicción de casos, como para la predicción de decesos. (Anexos: Cuadros 4, 5,
6 y 7).
En adelante, se exhiben los gráficos que ilustran el resultado de las estimaciones
efectuadas por número de casos y decesos en relación con la presencia de Covid-19
detectados diariamente en los países de la Alianza del Pacífico (Chile, Colombia,
México y Perú), a partir de una submuestra compuesta inicialmente de 176 días
comprendidos entre el 22 enero y el 15 de agosto de 2020.
Análisis de casos en los países de la Alianza del Pacífico
El número de casos diarios presenta un fuerte crecimiento exponencial a partir
del 20 de marzo, cuatro semanas después de la declaración de primer contagio.
En el mes de agosto continúa aumentando el número de infectados llegando a
383.902 infectados. En un escenario optimista se estima que iniciaría el descenso
de contagios ocurridos a mediados de agosto con 324.379,22 contagios, según los
resultados propuestos por el modelo Arima. Las predicciones en ambos modelos
presentan una disminución de la velocidad de contagios, indicando una cercana
fase de estabilización y aplanamiento de curva.
Los resultados evidencian un crecimiento acelerado de la epidemia, especialmente
a partir de la primera semana de junio, eso sugiere que las medidas de prevención
frente a la propagación y contagio del Covid-19 suscitadas en Colombia fueron
rezagadas. De acuerdo con los resultados, si se mantiene constante el número de
contagios diarios, las predicciones sugieren en ambos modelos que se superarán
los 350.000 infectados a mediados de agosto.
En México es posible advertir que desde la mitad de mayo se ha generado un
estallido del proceso epidemiológico con respecto al Covid-19, el número de casos
prácticamente se sextuplica comparado con el mes inmediatamente anterior,
pasando de 8.772 (20 de abril) a 56.594 infectados (20 de mayo). En este escenario,
los valores pronosticados para el mes de agosto son muy elevados con registros
potenciales que alcanzan el número de 500.000 contagios.
En Perú, el 6 de marzo marca el inicio del proceso de expansión del número de
contagios, bajo una secuencia que implicaba un ritmo de casos que se duplicaba
cada 3 días. En los meses siguientes el factor multiplicativo fue de 2 y 3 por cada
semana, con un ascenso significativo a partir del 8 de abril reportando 4.342
infectados, de acuerdo con el incremento en el número de pruebas realizadas. El
máximo número de infectados se aproximó a 500.000 personas al 15 de agosto.
Análisis de decesos en los Países de la Alianza del Pacífico
En Chile, después del 23 de abril, el número de muertes presenta un crecimiento
desigual pero constante. A mediados de agosto se pronostica en ambos modelos
más de diez mil muertes por Covid-19. En un escenario favorable, para este mismo
periodo, la curva tiende a estabilizarse con una predicción de 7.439 decesos,
aproximadamente cuatro mil muertes menos que en una predicción pesimista
según el modelo Arima.
Al igual que Chile, el primer fallecimiento fue el 23 de marzo, a partir de la fecha,
se evidencia un incremento constante en el número de decesos. Analizando
los modelos, para la segunda semana de agosto se estima que en Colombia
se sobrepasarán los 12.000 fallecidos. En este caso no es posible advertir un
aplanamiento de la curva en ninguno de los escenarios. Según la Universidad
de Oxford, el 30 de julio fue la fecha con registros más elevados, reportando 7,47
muertes por millón de habitantes, con un total de 9.810 fallecidos a causa de
Covid-19.
La evolución del número de muertes notificadas cada día describe, como en todos los casos, un comportamiento ascendente. Las cifras de fallecidos aumentan particularmente para el periodo de junio a julio a un ritmo del 59,47%, pasando de 27.769 a 46.688 decesos, un 23.72% más que el mes respectivamente anterior. Para mediados de agosto se estiman más de 55.000 muertes por el virus.
En Perú, a finales del mes de abril, es notorio el aumento en el número de
defunciones llegando a más de mil muertes por el virus. En los modelos se estima
que más de veinte mil personas habrán perdido la vida por el Covid-19 para la
segunda semana de agosto.
Análisis de las Predicciones
Friedman (1967), en sus ensayos de economía positiva: planteó que la evaluación
de la capacidad explicativa y predictiva de un modelo podía efectuarse a través de
un sinnúmero de pruebas estadísticas. Sin embargo, también señaló que el mejor
diagnóstico posible se efectúa cuando se comparan los resultados de un modelo
con la realidad. En el siguiente apartado gráfico se ilustran las predicciones fuera
de muestra de los modelos tipo Arima y las funciones Gompertz para cada caso,
encontrando que la verosimilitud de los modelos es relativa según cada país. Por
ejemplo, en Chile las predicciones de casos son mejor evidenciadas durante la
mayor parte de julio y agosto por un modelo tipo Arima, sin embargo, al final de
la serie que considera la mitad de agosto, el modelo Gompertz se acerca de forma
más apropiada a los reportes oficiales.
La siguiente evaluación de pronóstico de análisis de casos y decesos a causa de
Covid-19 se evidencia en el periodo comprendido entre el 16 de julio y 15 de agosto
de 2020, implicando una submuestra de 176 observaciones diarias.
Para Colombia, es indudable que el modelo Gompertz es superior a la hora de
efectuar predicciones que se aproximen a la naturaleza expuesta por los registros
reportados. A medida que avanza el tiempo los pronósticos generados por las
funciones Arima pierden gradualmente más efectividad.
Un hecho relevante es que, en este contexto, las predicciones son inferiores a los
casos confirmados por las autoridades, lo que implica que la información evolutiva
sobre Covid-19 supera las estimaciones y, por lo tanto, sugiere un relajamiento
por parte de la población en términos de cuidado y la flexibilidad de las medidas
gubernamentales que le son complementarias.
En México, se evidencia que el modelo Gompertz es más efectivo a la hora de
efectuar pronósticos sobre casos reportados de Covid. Al igual que en Colombia,
el modelo Arima pierde efectividad cuando se trata de proyecciones. El patrón
de registro efectivo refleja que las proyecciones son inferiores a los reportes,
evidenciando un relajamiento por parte del ordenamiento social y las medidas de
control para contener la pandemia.
El caso peruano evidencia la misma secuencia de eventos descrita para Colombia
y México, esto es, los registros de caso superan las estimaciones. En este contexto,
la modelación Arima supuso un mayor acercamiento a los datos efectivos. Sin
embargo, a medida que avanza el tiempo, los pronósticos mantienen una brecha
cada vez más creciente de los casos reportados, brecha que se ilustra mucho más
si se toma como referencia el pronóstico tipo Gompertz.
Existe una crítica al análisis de casos, dado que los problemas de los sistemas de
información, la limitada oferta de pruebas por parte de algunas regiones periféricas,
los errores de diagnóstico, así como la presencia de agentes asintomáticos, sugiere
que existan dificultades a la hora de expresar con precisión las dimensiones que
en materia de contagio supone la pandemia.
De otra parte, el análisis de decesos resulta más confiable porque los reportes
expresan la causa de muerte asociada a un diagnóstico clínico especializado y
confirmado.
Como se ilustra, los decesos experimentados en Chile superan cualquier
predicción. Si bien la verosimilitud entre el modelo Gompertz (que resulta más
efectivo al principio de la muestra y el modelo Arima que termina siendo mejor)
constituye una característica evidenciada ya en el análisis de casos por contagio, el
escenario sugiere que los reportes sobrepasan las medidas contempladas por las
autoridades, lo que se traduce en una situación social que supera las expectativas
de política pública en la materia.
En el caso colombiano, el número de decesos es mejor explicado por el modelo
Arima. Sin embargo, el modelo Gompertz puede ser entendido como una medida
de techo; los reportes efectivos sobrepasan las estimaciones Arima, pero no
sobrepasan las estimaciones Gompertz, por cuanto estas pueden servir para
proponer esquemas de control y ampliar las brechas al disminuir el número de
decesos de forma sistemática.
En el caso mexicano existe una rivalidad a la hora de pronosticar los decesos. Este
enfrentamiento parece resolverse en las últimas fechas por el modelo Gompertz
que se aproxima con un ajuste adecuado a los reportes. Se recomienda considerar,
al igual que en Colombia, los modelos tipo Gompertz para decesos como medidas
de límite superior en el diseño de política pública.
Igual que como se había evidenciado con el número de casos, los decesos en
Perú superan las expectativas tipo Gompertz o Arima. Resulta no menos que
preocupante que las predicciones tengan convergencia entre ellas, pero sean
superadas por brechas constantes que amenazan con desarrollar un patrón
sistemático de aumento.
Teniendo en cuenta las anteriores estimaciones, se efectuó un pronóstico del 15
al 31 de agosto de 2020, tanto en los modelos Gompertz como en las funciones
tipo Arima, lo anterior con el objeto de inferir el comportamiento y desarrollo
del proceso de contagio, así como su velocidad. De igual manera, el ejercicio
permite evaluar el resultado de las medidas adoptadas por los países de la Alianza
del Pacífico hasta finales del mes de agosto, evidenciando que las cifras para
casos y decesos son crecientes, especialmente para Colombia y México que han
experimentado un abrupto estallido en el número de contagios y muertes.
“Al respecto, Álvaro Idrovo, epidemiólogo y profesor del Departamento de Salud
Pública de la Universidad Industrial de Santander, observa que México, Perú y
Chile, son dos escenarios diferentes. En ese sentido, explica que el camino que muestran
Chile y
Perú es similar al de Colombia, que contrasta con el de México,
que es un contexto donde no hubo un confinamiento definitivo a diferencia de los
tres primeros.” (Diario la Vanguardia, 2020).
En la tabla 1 se obtienen mejores estimaciones en el modelo Gompertz para Chile,
Colombia y México. Se observa que en quince días el número de contagios aumenta
significativamente para Colombia con 270.380 nuevos infectados, México 102.673,
Perú 102.308 (modelo Arima*) y Chile con 4.994. Para este último, los registros
disminuyen sus valores de número de contagios acumulados.
Según la OMS para inicios del mes de agosto, Colombia ocupó el duodécimo
lugar en cuanto a muertes y se acercó a los 11.000 fallecimientos. A mediados de
agosto, México se acerca al umbral de los 60 mil decesos y en la última jornada se
reportaron más de 200 muertes. En Chile se presentan 10.395 personas fallecidas
por coronavirus, con una tasa de letalidad (fallecidos respecto a confirmados) del
2.73% y, en Perú 25.856 perdieron la vida a causa del letal virus.
En la tabla 2, las estimaciones de número de muertes a 31 de agosto presentan
tasas de mortalidad altas con mejores acercamientos a la realidad con el modelo
Arima para Chile, Colombia y Perú.
En Colombia se prevé que fallecerán más de cinco mil personas en 15 días, Perú
sobrepasará el umbral de los 30.000 decesos, y Chile tendrá un incremento de
7.12% aproximándose a una fase de estabilización. México superará las 66 mil
muertes según la predicción del modelo Gompertz.
De acuerdo con lo anterior, es posible establecer las predicciones de la tasa de
letalidad por Covid-19 como un cociente entre el número de decesos y el número
de casos correspondientemente, ambos obtenidos de la función de pronóstico
más competitiva entre la tipología Gompertz o Arima. Los resultados se ilustran
a continuación:
Los resultados de los pronósticos en las tasas de mortalidad para el conjunto
de países que conforman la Alianza del Pacífico son superiores a la tasa global.
No obstante, en los casos particulares de Colombia y Chile las estimaciones son
ligeramente inferiores.
Para el 15 de agosto, las cifras de tasa de mortalidad reales siguen superando a las
predicciones, exceptuando el caso de México, en el cual, el pronóstico es 0.02%
más que el reportado. Para finales de agosto para México y Perú, se presenta el
caso contrario, los datos reales son menores a las predicciones en un 0.09% y 0.61
respectivamente. En general, para la Alianza del Pacifico, la tasa de mortalidad
disminuye un 0.24% según reportes reales, diferenciándose de las estimaciones
que presentaban un incremento de 0.28% con un desfase de 0.04%.
Conclusiones
Los modelos matemáticos, estadísticos y epidemiológicos se constituyen en
inexorables herramientas de análisis para estudiar la dinámica de la pandemia y el
establecimiento de escenarios diversos, a través de los cuales, sea posible advertir
la respuesta que la política pública en materia de salud ejerce sobre su sociedad.
Pese a lo anterior, es necesario señalar que, como toda herramienta analítica
experimenta limitaciones naturales. Por consiguiente, debe comprenderse que
las predicciones no pretenden precisión como objetivo ineluctable, tampoco
pretenden establecer los determinantes económicos, sociales, demográficos,
entre otros que explican los valores de pronóstico, su trabajo más bien resulta
indicativo. En este estudio los decesos fueron mejor pronosticados en modelos
tipo Arima, en contraste, para las predicciones de casos resultaron más eficientes
las estimaciones en modelo Gompertz.
Con base en los modelos es posible establecer que:
La letalidad del virus es considerable, la cuantificación de personas infectadas
no constituye una estadística absoluta, la presencia de asintomáticos, así como
las limitaciones en la oferta de pruebas de diagnóstico constituyen restricciones
relevantes para ejercer modelaciones definitivas.
En la mayor parte de los análisis cuantitativos las predicciones fueron superadas
por las cifras reales, lo que sugiere no solo que el crecimiento en el número de
contagios y de decesos ha superado las expectativas, sino que además pone en
evidencia la eficacia de los procesos de cuarentena adoptados por cada país.
7. Recomendaciones
El problema parece cultural, puesto que el creciente ritmo de contagios y muertes
sugiere una ineficaz política pública para controlar la pandemia, que además es
vulnerada por quienes no acatan los protocolos de autocuidado. Adicionalmente,
la baja efectividad en el control se relaciona con la ausencia de garantías mínimas
de una población con necesidades económicas crecientes.
Una de las claves del problema estriba en el manejo de los protocolos de
confinamiento y control, una consciencia colectiva y la existencia de una
disciplina para que las personas asuman como una nueva cultura las medidas de
bioseguridad.
8. Referencias bibliográficas
Diario La Vanguardia. (Julio 5 de 2020). Covid-19: un virus “fuera de control” en
Perú, Chile y México. Recuperado de https://www.vanguardia.com/mundo/
covid-19-un-virus-fuera-de-control-en-peru-chile-y-mexico-CF2575062
Friedman, M. (1967). La metodología de la economía positiva. En Ensayos de
economía positiva. Madrid: Gredos.
Gompertz, B. (1825). On the nature of the function expressive of the law of human
mortality, and on a new mode of determining the value of life contingencies.
1825. Recuperado de http://www.med.mcgill.ca/epidemiology/hanley/c609/
material/Gompertz-1825.pdf
Gujarati, D., y Porter, D. (2010). Econometría, 5.a ed. México: McGraw Hill.
John Hopkins University. (2020). Global Map and data in motion. Coronavirus
resource center. Recuperado de https://coronavirus.jhu.edu/map.html
Minsalud. (2020). Biblioteca Digital. Obtenido de Resolución n.° 385 del 12 de
marzo de 2020. Recuperado de https://www.minsalud.gov.co/sites/rid/Lists/
BibliotecaDigital/ RIDE/DE/DIJ/resolucion-385-de-2020.pdf
OMS. (2020). Covid-19 data reported by countries and territories in the Region of
the Americas. Recuperado de https://ais.paho.org/phip/viz/COVID-19EpiDashboard.asp
9. Anexos