key: cord-0215061-iibgsr5l authors: F'elix-Medina, Mart'in H. title: Estimaci'on del n'umero de reproducci'on de la epidemia COVID-19 en Culiac'an Sinaloa, M'exico date: 2020-04-21 journal: nan DOI: nan sha: e5d5be3253b902f64264608f5065d193d0282562 doc_id: 215061 cord_uid: iibgsr5l Currently the COVID-19 epidemic is developing in the City of Culiac'n Sinaloa, Mexico, where up to April 20 of this year there have been 35 deaths associated with this epidemic. The reproduction number $(R_0)$ of an epidemic represents the average number of people infected by an infected person during their period of infection. In this work we use the data published by the Secretary of Health of the State of Sinaloa on the number of new infected cases confirmed per day and we estimate that the value of $R_0$ is 1.562 with a 95% confidence interval given by (1.401,1.742). We also estimate the mortality rate among the confirmed cases, which turned out to be 16.8%. - - - - - Actualmente la epidemia COVID-19 se est'a desarrollando en la Ciudad de Culiac'an Sinaloa, M'exico, donde hasta el 20 de abril del presente a~no han ocurrido 35 decesos asociados con esta epidemia. El n'umero de reproducci'on $(R_0)$ de una epidemia representa el n'umero promedio de personas contagiadas por una persona infectada durante su periodo de infecci'on. En este trabajo usamos los datos publicados por la Secretaria de Salud del Estado de Sinaloa sobre el n'umero de nuevos casos infectados confirmados por dia y estimamos que el valor de $R_0$ es de 1.562 con un intervalo del 95% de confianza dado por (1.401,1.742). Estimamos tambi'en la tasa de mortalidad entre los casos confirmados, la cual result'o ser de 16.8%. La epidemia COVID-19 inició en Sinaloa el pasado mes de marzo. No obstante la medida "Quédate en casa" de confinamiento en los hogares adoptada a nivel nacional, la epidemia ha continuado avanzando en Sinaloa y particularmente en Culiacán, donde se han presentado el mayor número de casos confirmados y de decesos provocados por esta enfermedad. Por tal motivo, es de interés conocer algunos parámetros relacionados con este brote epidémico en esta ciudad. Un parámetro que permite caracterizar una epidemia es el número de reproducción o tasa de reproducción intrínseca (R 0 ), el cual representa el número promedio de personas contagiadas por una persona infectada durante su periodo de infección. Este parámetro es importante porque si R 0 > 1, entonces el número de personas contagiadas crecerá de manera exponencial, mientras que si R 0 < 1, el número de contagios disminuirá de forma exponencial, y consecuentemente, el brote epidémico desaparecerá rápidamente sin producirse muchos contagios. Estimaciones de R 0 correspondientes a epidemias COVID-19 que se presentaron en China y en otros lugares varían entre 1,4 y 6,49, con media 3,28 y mediana 2,79 (véase Liu et al. 2020) . Zhang et al. (2020) obtuvieron una estimación de 2,28 para el caso de la epidemia COVID-19 que se presentó en el Crucero "Diamond Princess". Estos autores utilizaron el método propuesto por Fraser (2007) e implementado en el paquete "earlyR" (Jombart et al., 2017) del sistema de cómputo R (R Core Team, 2020) para obtener esta estimación. En este trabajo, presentamos una estimación de R 0 durante las fases iniciales de la epidemia COVID-19 que está actualmente desarrollándose en la Ciudad de Culiacán Sinaloa. Con este propósito utilizamos los datos oficiales de casos confirmados publicados por la Secretaría de Salud del Estado de Sinaloa y el paquete "earlyR" del sistema de cómputo estadístico R. Presentamos, asimismo, un pronóstico del número de nuevos casos confirmados por día que se espera que ocurran en las próximas tres semanas. Presentamos también una estimación de la tasa de mortalidad entre los casos confirmados para Culiacán, así como un pronóstico del número de nuevos decesos que se espera que ocurran por día en las próximas tres semanas, el cual obtuvimos a partir del número de nuevos decesos y del número de nuevos casos recuperados ocurridos por día resportados por la Secretaría de Salud Sinaloa. 2 Método de Fraser para la estimación de R 0 El método propuesto por Fraser (2007) para estimar R 0 en las etapas iniciales de la epidemia consiste en considerar que el número de nuevos infectados I(t) al tiempo t es una variable aleatoria Poisson con media donde β(t, τ ) > 0 es la función de transmisibilidad de la enfermedad por un infectado. Esta función depende del tiempo t que lleva la epidemia y del tiempo τ al que ocurrió el contagio. El número promedio de personas contagiadas R 0 (t) al tiempo t por una persona infectada se relaciona con la función de transmisibilidad β(t, τ ) mediante donde φ 2 (τ ) > 0 y ∞ 0 φ 2 (τ )dτ = 1, esto es, que φ 2 (τ ) es una función de densidad de probabilidad. Note que este supuesto implica que la transmisibilidad de la enfermedad por un contagiado depende de una función φ 1 (t) del tiempo t que lleva la epidemia y de la distribución de probabilidad φ 2 (τ ) del tiempo τ al que ocurrió el contagio. Esta función φ 2 (τ ) se conoce como "perfil de infectabilidad". De (2) y (3) se sigue que R 0 (t) = φ 1 (t), y nuevamente de (3) se sigue que β(t, τ ) = R 0 (t)φ 2 (τ ). Por tanto, de (1) se tiene que Dado que los números de nuevos infectados se reportan en tiempos discretos (por ejemplo diariamente), Fraser (2007) discretiza la función φ 2 (τ ) mediante la función de probabilidad de masa w(j), j = 1, . . . , n, y estima E [I(t)] por I(t). Así, estima R 0 (t) mediantê . Note que para calcularR 0 (t) se requiere conocer la función de probabilidad de masa w(j), j = 1, . . . , n. Cori et al. (2013) indican que en la práctica w se reemplaza por la distribución de probabilidad del tiempo que transcurre desde que inician los síntomas de una persona enferma hasta que inician los síntomas de una persona contagiada por ella. Esta distribución se conoce como la distribución del intervalo de casos sucesivos ("serial interval") y se aproxima mediante una distribución Gamma discretizada cuyos parámetros se obtienen de casos observados o de reportes en la literatura. Estos autores también señalan que este estimador de R 0 (t) es válido aún si los valores reportados de I(t) son de nuevos casos confirmados de infectados y no de nuevos casos infectados en general (confirmados o no confirmados). Esto es así ya que al calcularse mediante un cociente, si los nuevos casos confirmados son una fracción constante del total de nuevos casos infectados, el factor de proporcionalidad se cancela y no afecta el valor del estimador. Cabe señalar que Cori et al. (2013) usan el modelo de Fraser (2007) para desarrollar un enfoque Bayesiano para estimar R 0 . Ellos suponen una distribución inicial Gamma para R 0 y muestran que la distribución final de R 0 es también Gamma. Estos autores indican que las estimaciones de R 0 (t) que se obtienen mediante este enfoque son bastante variables, por lo que se requiere especificar un intervalo de tiempo (ventana de tiempo) en el que se supone que R 0 (t) se mantiene constante. El paquete "earlyR" del sistema R usa la distribución posterior de R 0 para construir intervalos de confianza bayesianos de este parámetro mediante la simulación de valores de la distribución posterior. Nouvellet et al. (2018) usan el modelo Bayesiano de Cori et al. (2013) y desarrollan un procedimiento para pronosticar valores del número de nuevos casos I(t). El procedimiento consiste en generar valores de la distribución posterior de I(t) mediante la metodología de simulación Monte Carlo de Cadenas de Markov (MCMC por sus siglas en Inglés), y a partir de los valores generados calcular los pronósticos de I(t), así como sus correspondientes intervalos de confianza bayesianos. Este procedimiento fue implementado por Jombart et al. (2018) en el paquete "projections" del sistema R. Aunque idealmente el objetivo es tener información sobre la tasa de mortalidad entre la población infectada, este parámetro no lo podemos estimar debido a que desconocemos el número de infectados. Sin embargo, es factible estimar la tasa de mortalidad entre los casos confirmados ya que se cuenta con la información necesaria. No obstante que este parámetro podría no ser de interés por sí mismo, ya que los casos confirmados es un grupo de personas con características muy particulares las cuales dependen del criterio que se use para confirmar si tienen o no la enfermedad, la estimación de la tasa de mortalidad de este grupo permite pronosticar el número de decesos que se espera que ocurran en un futuro. De acuerdo con Ghani et al. (2005) , dos estimadores simples de calcular de la tasa de mortalidad al día t de la epidemia son donde D(s), I(s) y R(s) representan los números de nuevos decesos, nuevos infectados y nuevos recuperados que ocurren en el día s. Note que no necesariamente ya que al día t existen personas que están infectadas, pero que no se han recuperado ni han fallecido. Por tanto, el primer estimadorp 1 (t) no toma en cuenta el estado final (recuperación o deceso) de esas personas, y consecuentemente, tiende a subestimar la tasa de mortalidad ya que posiblemente ocurra el deceso de algunas de esas personas. El segundo, estimadorp 2 (t) corrige el problema de subestimación al considerar sólo los casos para los cuales se conoce su estado final. Aunque existen otros estimadores de la tasa de mortalidad con mejores propiedades estadísticas que los arriba señalados, por ejemplo Ghani et al. (2005) proponen un estimador del tipo Kaplan-Meier que toma en cuenta el número de personas infectadas al día t para las cuales se desconoce su estado final, estos son más difíciles de calcular, y en estudios numéricos se ha encontrado que el estimador p 2 (t) tiene un desempeño aceptable. 4 Estimación de R 0 en la etapa inicial de la epidemia COVID-19 en Culicán Sinaloa El primer caso confirmado de COVID-19 en la Ciudad de Culiacán se presentó el 28 de febrero del presente año. Este caso correpondió a una persona originaria del Estado de Hidalgo y que previamente a su llegada a la Ciudad de Culiacán estuvo en Italia, donde se presume que fue contagiado. Desde esa fecha hasta el 19 de abril han transcurrido 52 días y se han reportado 328 casos confirmados de COVID-19. La gráfica de la Figura 1 muestra el número de nuevos casos confirmados por día. Como se indicó en la sección anterior, el método de Fraser para estimar R 0 requiere que se definan los parámetros de la distribución Gamma que describe la distribución del intervalo de casos sucesivos. Dado que no tenemos información que nos permita estimar estos parámetros para el caso particular de la epidemia que se presenta en Culiacán, al igual que en Zhang et al. (2020) , usaremos los valores correspondientes a la epidemia COVID-19 presentada en Wuhan China y reportados por Li et al. (2020) . Así, consideraremos que la media y la desviación estándar de esta distribución son 7.5 y 3.4 días, respectivamente. Luego, mediante el uso de la función "get R" del paquete "earlyR", obtenemos que la estimación máximo verosímil de R 0 es 1.562 (véase la gráfica de la Figura 2), esto es, cada persona enferma infecta a alrededor de 1.56 personas durante su periodo de contagio. Un intervalo bayesiano del 95 % de confianza de R 0 , obtenido mediante la simulación de 10 000 valores de la distribución posterior de R 0 , y generados mediante la función "sample R" del paquete "earlyR", es (1,401, 1,742). Así, con probabilidad 0.95, el valor de R 0 está entre 1.40 y 1.74. Cabe aclarar que la estimación de R 0 se obtuvo bajo el supuesto de que el número de nuevos casos confirmados por día es una fracción, que se mantiene constante a lo largo del tiempo, del número total de nuevos casos infectados que ocurren por día. Si esa fracción no se mantiene constante, por ejemplo, si al principio de la epidemia el número de nuevos casos confirmados es una fracción grande del número de nuevos casos infectados, y conforme aumenta el número de nuevos casos infectados esa fracción disminuye, entonces la estimación que obtuvimos subestimará el verdadero valor de R 0 . Así, es factible que nuestra estimación sea realmente una cota inferior de R 0 . No obstante que se puede estimar R 0 sin conocer el valor exacto del número de infectados, para poder realizar pronósticos del número de nuevos infectados por día mediante el método propuesto por Nouvellet et al. (2018) se requiere conocer el número de nuevos infectados I(t) por día. Sin embargo, es posible pronosticar el número de nuevos casos confirmados por día que se presentarán en el futuro. Este ejercicio es importante porque muestra la tendencia que se espera que tengan los nuevos casos confirmados y, bajo el supuesto de que los nuevos casos confirmados son una fracción constante de los nuevos casos infectados, se sigue que los nuevos casos infectados tendrán una tendencia similar. En la Figura 3 se muestra la gráfica de los valores pronosticados de los nuevos casos confirmados, calculados mediante la mediana de la distribución posterior de I(t), (curva correspondiente al cuantil 50 %), así como las bandas bayesianas de confianza del 90 %, 95 % y 99 %, obtenidas mediante la función "project" del paquete"projections" y usando 10 000 valores simulados de la distribución posterior para cada día. Como se observa en la gráfica de la Figura 3, la tendencia del número de nuevos casos confirmados, y por tanto, la de los nuevos casos infectados, es creciente hasta mayo 10. Por lo que, de acuerdo con este modelo, si se mantienen las condiciones actuales, el número de nuevos infectados por día continuará creciendo de forma exponencial. 5 Estimación de la tasa de mortalidad entre los casos confirmados de la epidemia COVID-19 en Culicán Sinaloa En la gráfica de la Figura 4 se muestra la incidencia de nuevos decesos diarios registrados hasta abril 19. Las estimaciones de la tasa de mortalidad diarias entre los casos confirmados, calculadas mediante el estimador (4) se muestran en la gráfica de la Figura 5. Dado que al día 19 de abril se tenían 173 casos recuperados y 35 decesos, la estimación de la tasa de mortalidad para ese día es de 35/(173+35)=0.168. Observe que la alta variabilidad de los valores de las estimaciones de la tasa de mortalidad diaria se debe a que al principio los totales de los casos recuperados y de decesos son relativamente pequeños, y conforme estos van aumentando, la estimación de la tasa de mortalidad se va aproximando a su valor real. Si consideramos que la tasa de mortalidad se mantiene constante en 0.168, podemos pronosticar los nuevos decesos por día que ocurrirán en las próximas tres semanas multiplicando los valores pronosticados de los nuevos casos confirmados por 0.168. Los valores pronosticados y las correspondientes bandas bayesianas del 95 % de confianza se muestran en la gráfica de la Figura 6. Obsérvese que para el 10 de mayo estarían ocurriendo entre 15 y 25 nuevos decesos diarios con probabilidad 0.95. En la gráfica de la Figura 7 se muestran los pronósticos del número de decesos acumulados para cada día y las correspondientes bandas bayesianas del 95 % de confianza que se espera que ocurran durante las próximas tres semanas. En este trabajo se usaron los datos publicados por la Secretaría de Salud del Estado de Sinaloa sobre el número de nuevos casos confirmados diarios de COVID-19 en Culiacán Sinaloa para estimar el número promedio de personas que contagia una persona infectada durante su periodo de contagio (R 0 ). La estimación que se obtuvo fue de 1.56. Esta estimación se obtuvo bajo el supuesto de que el número de nuevos casos confirmados diarios es una fracción constante del número de nuevos contagios diarios que ocurren. Si esa fracción no es constante, sino que conforme aumenta el número de nuevos casos infectados diarios la fracción de nuevos casos confirmados disminuye, lo cual es factible que ocurra, la estimación que se obtuvo es una subestimación del verdadero valor de R 0 . Se considero también la estimación de la tasa de mortalidad diaria entre los casos confirmados usando los números de nuevos decesos diarios reportados y de nuevos casos recuperados diarios. Estosúltimos números se obtuvieron substrayendo del total de casos infectados acumulados para cada día, la suma del números de casos activos (infectados confirmados) que se tienen por día (los cuales son reportados por la Secretaría de Salud) y el número de decesos acumulados para cada día. La estimación que se obtuvo para el día 19 de abril fue de 0.168. Este valor puede parecer alto si se compara con las que se han publicado para otros lugares. Por ejemplo, Baud et al. (2020) estiman que el 1 de marzo la tasa de mortalidad en China fue de 0.056 con un intervalo del 95 % de confianza de (0,54, 0,58), mientras que para el resto de los países (tomados en conjunto) fue de 0.152 con un intervalo del 95 % de confianza de (0,125, 0,179). Existen dos razones por las cuales el valor que obtuvimos para Culiacán sea realtivamente grande. Una es que la estimación corresponde a la tasa de mortalidad entre los casos confirmados y no entre los casos infectados. Es factible que una buena parte de los casos confirmados esté formada por personas que requieren atención hospitalaria, y por tanto, tengan un mayor riesgo de muerte. La otra es que los datos sobre el número de nuevos casos recuperados por día no sean actualizados diariamente por la Secretaría de Salud, y por tanto, el denominador de la expresión dep 2 (t) sea menor que el valor real. En este caso, nuestra estimación sería una sobreestimación. Vale la pena señalar que para obtener una estimación de la tasa de mortalidad entre todos los infectados se requiere estimar el total de infectados en la población. Una manera de hacerlo sería aplicar el cuestionario que diseñó la Secretaría de Salud de Sinaloa para identificar un caso sospechoso a una muestra de familias seleccionadas mediante marcación aleatoria de dígitos telefónicos. Con esta muestra se podría estimar la fracción de casos sospechos en la población y con información sobre la proporción de casos confirmados que se obtienen de los casos sospechosos se podría estimar la fracción de casos infectados en la población. Con esta estimación y con información sobre el tamaño de la población en Culiacán se podría estimar el total de casos infectados en el municipio. Real estimates of mortality following COVID-19 infection. The Lancet Infectious Diseases A new framework and software to estimate time-varying reproduction numbers during epidemics Estimating individual and household reproduction numbers in an emerging epidemic Methods for estimating the case fatality ratio for a novel, emerging infectious disease earlyR: Estimation of transmissibility in the early stages of a disease outbreak projections: Project future case incidence Early transmission dynamics in Wuhan, China, of novel coronavirus -infected pneumonia The reproductive number of COVID-19 is higher compared to SARS coronavirus A simple approach to measure transmissibility and forecast incidence R: A language and environment for statistical computing. R Foundation for Statistical Computing Estimation of the reproductive number of novel coronavirus (COVID-19) and the probable outbreak size on the Diamond Princess cruise ship: A data-driven analysis