key: cord-0557056-gxsucucf authors: Krivorotko, O. I.; Kabanikhin, S. I. title: Mathematical models of COVID-19 spread date: 2021-12-10 journal: nan DOI: nan sha: 2c89e56735a242a9fa89bf68a68715b608e8eb55 doc_id: 557056 cord_uid: gxsucucf The paper presents classification and analysis of the mathematical models of COVID-19 spread in different groups of populations such as the family, school, office (3-100 people), neighborhood (100-5000 people), city, region (0.5-15 million people), country, continent and the world. The classification covers the main types of models including time-series, differential, imitation ones, and their combinations. The time-series models are built from analysis of the time series derived using filtration, regression and network methods (Section 2). The differential models include those derived from systems of ordinary and stochastic differential equations as well as partial-derivative equations (Section 3). The imitation models include cellular automata and agent-based models (Section 4). The fourth group in the classification is combinations of nonlinear Markov chains and optimal control theory, derived within the framework of the mean-field game theory. Due to the novelty of the disease and the difficulties it causes, the parameters of most models are, as a rule, unknown, which necessitates one to solve the inverse problem, so the paper also analyses the main algorithms to solve the inverse problem such as stochastic optimization; nature-like algorithms (genetic; differential evolution; particle swarm, etc.); the understanding method; big-data analysis, and machine learning. В работе приведена классификация и анализ математических моделей распространения COVID-19 в различных группах населения: семья, школа, офисы (3-100 человек) , регионы (100-5000 человек), города, области (0.5-15 миллионов человек), страны, континенты и Земной шар. Рассмотрены основные группы моделей (основанные на анализе временных рядов, дифференциальные, имитационные, а также их комбинации). В основе первой группы лежит анализ временных рядов на основе методов фильтрации, регрессионных и сетевых моделей (Раздел 2). Вторая группа основана на уравнениях (Раздел 3): системы обыкновенных дифференциальных уравнений, стохастические дифференциальные уравнения, уравнения в частных производных. Третья группа (Раздел 4) -имитационные модели, включая клеточные автоматы и агентноориентированные модели. Четвертая группа моделей (Раздел 5) основана на комбинации нелинейных марковских цепей, оптимального управлении, объединенных в рамках теории игр среднего поля. В силу новизны и сложности заболевания COVID-19 параметры большинства моделей, как правило, неизвестны, и это приводит к необходимости рассматривать и решать обратные задачи. В работе приведен анализ основных алгоритмов решения обратных задач эпидемиологии: стохастическая оптимизация, природоподобные алгоритмы (генетический, дифференциальной эволюции, роя частиц и т.п.), методы усвоения, анализа больших данных и машинного обучения. 1 Введение В работе изложены математические основы программного комплекса COVID-19, созданного в СО РАН совместно с коллегами из РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина (Снежинск), ФИЦ КНТ (Красноярск), МФТИ и МГУ (Москва), а также коллегами из Болгарии, Великобритании, Казахстана, Китая, США. В основе комплекса программ лежит комбинация трех основных типов моделей: SIR, АОМ и ИСП. В работе рассматриваются математические модели, которые используются для анализа и прогнозирования развития пандемии COVID-19, включая анализ временных рядов, уравнения математической физики и имитационные модели, различные их комбинации и обобщения. В силу новизны и сложности заболевания COVID-19 параметры большинства математических моделей, как правило, неизвестны, и это приводит к необходимости рассматривать и решать обратные задачи. Основные проблемы моделирования распространения COVID-19: 1. Данные для решения обратной задачи являются неполными и зашумленными, а также представляют собой большие данные (ежедневные сводки о заболевших, заразившихся, вакцинированных и т.д.). 2. Параметры меняются со временем: контагиозность ( ), вероятность появления тяжелых случаев 1 − ( ), смертность ( ), процент бессимптомных случаев ( ) и т.д. 3. Процесс распространения COVID-19 существенно изменяется при введении или зультаты численных расчетов проанализированы в разделе 7.1. Также в подразделе 7.3 сформулированы выводы и в 7.4 -направления дальнейших исследований. В приложении A изложено описание используемых эпидемиологических данных распространения COVID-19 в Новосибирской области, используемые в численных расчетах. В приложении B приведено описание комплекса программ и характеристики численных расчетов. В качестве иллюстрации в работе приведены результаты расчетов по трем моделям: SEIR-HCD -камерная модель, основанная на системе из 7 обыкновенных дифференциальных уравнений (Раздел 3.5.2) , агентная (Раздел 4.3.1) и модель игры среднего поля (Раздел 7.2). 2 Модели, основанные на анализе временных рядов В разделе будут рассмотрены регрессионные и сетевые модели, методы фильтрации и их взаимосвязи [М.А. Кондратьев, 2013] , на основе анализа наиболее достоверных статистических данных -количество ежедневных ПЦР-тестов ( ) и индекс самоизоляции ( ). Время во всех моделях измеряется в днях. Особенностью функций ( ) и ( ) является повторяемость подъемов и спадов по времени с изменяющейся амплитудой. Например, ( ) возрастает по вторникам и ослабевает к понедельнику, а ( ) ослабевает в период выходных, праздников и отпусков. Методы математической статистики и машинного обучения помогают обрабатывать, анализировать эпидемиологические данные и проводить краткосрочное прогнозирование поведения ( ) и ( ) при отсутствии резких изменений ситуации (введение ограничительных мер, мутации вируса) [В.В. Захаров, Ю.Е. Балыкина, 2021] . В разделе будут приведены регрессионные, сетевые модели, а также методы фильтрации и их взаимосвязи, диаграмма которых приведена на рис. 2.1. Отметим, что в данном разделе мы рассматриваем модели, которые используют только значения наблюдаемых показателей ( ) и ( ). Регрессионные модели подразделяются на неадаптивные модели, для оценки параметров которых используются все имеющиеся данные, и адаптивные, значения параметров которых рассчитываются на основе скользящего окна наблюдений [H.S. Burkom et al., 2007] . Вид регрессионной зависимости для неадаптивной модели выбирается исходя из свойств анализируемого временного ряда. В отдельных случаях можно применять полиномиальные или степенные функции, но чаще модель должна учитывать сезонный характер заболеваемости (например, модель Серфлинга [R.E. Serfling, 1963] ). Неадаптивные регрессионные модели учитывают всю предысторию заболеваемости, но игнорируют локальные колебания эпидемических показателей, поэтому появление нового штамма вируса и введение ограничительных мер в регионе снижают значимость данных предыдущего периода (устаревшие данные). Адаптивные регрессионные модели используют ограниченный отрезок временного ряда и поэтому более чувствительны к изменению ситуации. Важную роль при использовании адаптивных моделей играет ширина скользящего окна (в пределах нескольких месяцев) -число последних наблюдений, на основе которых оценивают параметры модели. В регрессионных моделях предполагается, что невязка модели (ошибка предсказания) -независимая случайная величина, имеющая нормальный закон распределения с нулевым математическим ожиданием и постоянной дисперсией [М.А. Кондратьев, 2013] . Одной из проблем прогнозирования является наличие существенной автокорреляции невязок. Регрессионная модель может быть дополнена, а прогноз -уточнен, например, с помощью авторегрессионных моделей. Для построения прогнозов сезонных рядов, например, количества проведенных ПЦР-тестов в регионе, использовалась авторегрессионная модель SARIMA являющейся модификацией модели ARIMA (AutoRegressive Integrated Moving Average) [Д. Бокс, Г. Дженкинс, 1974] , которая описывает одномерные временные ряды с сезонной компонентой [P.P. Dabral, M.Z. Murry, 2017] . ARIMA является расширением моделей тип ARMA для нестационарных временных рядов, которые можно сделать стационарными взятием разностей некоторого порядка от исходного временного ряда (так называемые интегрированные или разностно-стационарные временные ряды). Модель ARIMA( , , ) для нестационарного временного ряда ( ) имеет вид: Здесь ( ) -стационарный временной ряд белого шума, , , -параметры модели, △ -оператор разности временного ряда порядка , гарантирующий стационарность ряда (последовательное взятие раз разностей первого порядка -сначала от временного ряда, затем от полученных разностей первого порядка, затем от второго порядка и т.д. Машинное обучение является мощным инструментом для поиска взаимосвязи между входными и выходными данными в случаях, когда аналитическое исследование затруднительно. Применение эвристических подходов для раннего обнаружения эпидемиологических рисков в некоторых случаях позволяет улучшить качество прогнозирования. Рис. 2.2: Результаты предсказания временного ряда ежедневно проводимых ПЦР-тестов ( ) в Новосибирской области (сплошная синяя линия) на месяц вперед с 18.01.2021 (вертикальная оранжевая линия) моделями Хольта-Винтерса (черная пунктирная линия), линейной регрессии (синяя пунктирная линия) и SARIMA (зеленая пунктирная линия). Одним из представителей моделей машинного обучения являются динамические байесовские сети -ориентированный граф, вершины которого соответствуют переменным модели, а ребра -вероятностным зависимостям между ними, которые заданы определенными законами распределения [P. Sebastiani et al., 2006] . После обучения как на большом, так и на малом количестве исходных данных байесовские сети позволяют оценить вероятность наступления некоторого события при наблюдаемой последовательности явлений. Для прогнозирования заболеваемости используется простая форма скрытых марковских моделей, основной идеей которых является сопоставление каждой случайной величины (например, количество выявленных, госпитализированных случаев с COVID-19) с ненаблюдаемой случайной величиной (например, общее количество инфицированных индивидуумов), определяющей условное распределение [Y.Le Strat, F. Carrat, 1999] . Таким образом, величина зависит только от значения скрытой переменной в момент времени , а последовательность обладает марковским свойством, то есть величина зависит только от −1 (рис. 2.3а). Рис. 2.3: Схема зависимостей в скрытой марковской модели (а) и ИНС с одним скрытым слоем (б). Искусственные нейронные сети (ИНС) представляют собой направленный взвешенный граф, вершины которого моделируют функционирование биологических нейронов (рис. 2.3б). Обучение ИНС заключается в вычислении коэффициентов связей между вершинами, определяющих силу входящих сигналов, и выполняется на основе эмпирических данных: статистики заболеваемости и при наличии, значений факторов, ее предопределяющих. Для корректного обучения ИНС необходим большой объем исторических данных. В исследовании [M. Wieczorek et al., 2020] рассматриваются возможности применения нейронных сетей для прогнозирования распространения COVID-19. Результаты работы сети разработанной архитектуры для некоторых регионов достигали 87%. Любые временные ряды заболеваемости можно рассматривать как случайный процесс, состоящий из сигнала, отражающего реальную эпидемическую обстановку, и высокочастотного шума. Фильтрация шума позволяет уточнить прогноз и может выполняться как в ходе предварительной обработки исходных данных, так и в составе самого алгоритма прогнозирования. Одним из подходов является вейвлет-декомпозиция, в которой временной ряд представляется с помощью вейвлет-функций [G. Shmueli, S.E. Fienberg, 2006] . Однако, такой подход используется совместно с другими моделями. Одной из таких моделей является экспоненциальное сглаживание, представляющее собой частный случай взвешенного скользящего среднего, а именно значение заболеваемости в момент времени описывается взвешенной суммой последних наблюдений: = +(1− ) −1 . Здесь ∈ (0, 1) -коэффициент сглаживания, который обеспечивает уменьшение веса по мере старения данных, которое может рассматриваться как отражение естественного процесса обучения. Такой метод построения модели не подходит для рядов, в поведении которых присутствуют отчетливый тренд или сезонность. Для этих целей используются обобщенные модели [E.S. Gardner, 1985] , например, сезонная модель Хольта-Винтерса [T. Williams, 1987] . Результаты прогнозирования ряда ежедневных ПЦР-тестов в Новосибирской области в рамках данной модели представлены на рис. 2.2. Любые эпидемические процессы можно описать следующей системой разностных уравнений: где x -вектор переменных состояний системы в момент времени , y -вектор наблюдений, f -вектор значений внешних факторов, w и v -белый шум. Матрицы параметров A, H, D определяют модель эпидемического процесса и выбираются исходя из решаемой задачи -краткосрочного или долгосрочного прогнозирования. Такая форма записи позволяет предложить обобщенные модели распространения заболевания, в частности, модели на основе калмановской фильтрации [J.D. Hamilton, 1994 ]. Результаты, полученные на основе временных рядов, использованы нами в дифференциальных и агентных моделях. Прогнозирование ежедневных ПЦР-тестов и индекса самоизоляции позволяют строить сценарии развития COVID-19 в регионе в зависимости от введения ограничительных мер, а именно количество ожидаемых выявленных, умерших, госпитализированных, критических случаев и индекса репродукции вируса (численные расчеты приведены в Разделе 7.1). 3 Модели, основанные на дифференциальных уравнениях В данном разделе приведен обзор математических моделей, основанных на обыкновенных дифференциальных уравнениях (ОДУ), приведенных в Разделе 3.2, на уравнениях в частных производных (УРЧП), описанных в Разделе 3.3, и на стохастических дифференциальных уравнениях (СДУ), приведенных в Разделах 3.4 и 5, а также описание ключевой характеристики распространения заболевания -индекс репродукции вируса (п. 3.5). В качестве примера будет представлена SEIR-HCD модель, описанная в п. 3.5.2. Дифференциальные модели основаны на законе сохранения масс и особенностях передачи инфекции. Диаграмма 3.1 иллюстрирует развитие моделей эпидемиологии с 1760 по настоящее время. Для описания распространения новой коронавирусной инфекции, вызванной вирусом штамма SARS-CoV-2 были использованы все основные достижения, отраженные в диаграмме 3.1. На рис. 3.2 приведена классификация существующих математических моделей динамики COVID-19 и их взаимосвязи. Одна из простейших моделей вспышки COVID-19 описывается логистическим уравнением (3.2) . Добавление состояний агентов (бессимптомные, госпитализированные, критические, умершие случаи и т.д.) к логистическому уравнению приводит к камерным SIR-моделям (3.1) и (3.5) . Учет пространственной неоднородности приводит к диффузионно-логистическому уравнению (3.3) . Дальнейшие преобразования камерных моделей можно условно разделить на два направления: учет пространственной структуры в непрерывной (модель реакции-диффузии) и дискретной (модель конечных автоматов) постановках. Добавление управления системами состояний формирует новый класс моделей ИСП (5.5)-(5.6), а учет индивидуальных характеристик агентовк АОМ. Отметим, что усреднение в АОМ приводит к моделям среднего поля, а именно нелинейным цепям Маркова, в которых вероятности перехода зависят от распределения состояний агентов (подробнее см. Раздел 5). Математическое моделирование в эпидемиологии началось с работы D. Bernoulli в 1760 году, в которой была продемонстрирована эффективность вакцинации населения против ветряной оспы [D. Bernoulli, 1760] . Впоследствии появилась серия математических моделей, основанные на законе баланса масс (см. обзорные статьи [N. Bacaer, 2011 , F. Brauer, 2017 и приведенную в них литературу). Работы R. Ross в 1911 [R. Ross, 1911] , A.J. Lotka в 1920 [A.J. Lotka, 1920 ] и V. Volterra в 1926 [V. Volterra, 1926 (модель «хищник-жертва»), привели к созданию камерной SIR-модели W.O. Kermack и A.G. McKendrick [A.G. McKendrick, 1926 , W.O. Kermack, A.G. McKendrick, 1927 которая является важнейшей характеристикой заболевания и параметром распространения эпидемии (см. подробнее раздел 3.5). Отметим, что частным случаем модели (3.1) при условии отсутствия иммунитета после перенесенного заболевания в рамках исследуемых временных промежутков (например, сезонный грипп) является SI-модель, решение которой сводится к логистическому уравнению: Важным свойством модели (3.1) является выполнение закона действующих масс (закон сохранения), в рамках которого моделируемая популяция постоянна в течение всего времени = ( ) + ( ) + ( ). В работах Е.Н. Пелиновского и его коллег [E. Pelinovsky et al., 2020 , P. Wang et al., 2020 , E.M. Koltsova, 2020 для моделирования распространения COVID-19 применяется обобщенное логистическое уравнение, описывающее рост численности заболевших. Предположение о единственности пика вспышки ( ) эпидемии ограничивает применение логистической модели для описания длительного периода пандемии и учета ограничительных мер. Для учета инкубационного периода течения COVID-19 используется модификация модели Кермака-Маккендрика SEIR-типа (схема SEIR-модели приведена на Рис. 3.3б), которых на сегодняшний день разработано более 100 моделей (см. например, работы [Y. Chen et al., 2020 , M.V. Tamm, 2020 , E. Unlu et al., 2020 а) SIR б) SEIR в) SEIR-HCD Рис. 3.3: Схемы камерных моделей (а) SIR, (б) SEIR и (в) SEIR-HCD. Borovkov et al., 2020 , H.M. Yang et al., 2021 , I.N. Kiselev et al., 2021 и ссылки в них). В этих моделях популяция разделяется на группы (кроме , , добавляются бессимптомные носители, -госпитализированные, -критические случаи, требующие подключения аппарата искусственной вентиляции легких (ИВЛ), -умершие в результате COVID-19, -помещенные на карантин и другие). Это позволяет уточнить эпидемиологическую картину в регионе за счет варьирования более детального набора коэффициентов в уравнениях. Недостатком SIR-моделей является отсутствие гибкости -невозможность учета изменения параметров (новые мутации вируса и штамма, ограничительные меры, вакцинация). При попытке ввести в SIR-модели указанные изменения (например, сделать переменной скорость передачи инфекции = ( )) [S. Margenov et al., 2021] , мы сталкиваемся с неединственностью и неустойчивостью решения обратной задачи идентификации этого параметра ( ). Отметим, что SIR-модели используют также для прогнозирования результатов управления развития пандемии [C.J. Silva et al., 2021] , т.е. в правую часть уравнений добавляют кусочно-постоянную функцию управления (ограничительные меры: ношение масок, социальная дистанция, карантин). Однако и в этих случаях проблема уточнения коэффициентов моделей SIR остается открытой и требует применения методов теории обратных задач. Также в SIR-моделях можно учитывать влияние суперраспространителей на распространение COVID-19 (инфицированные индивидуумы, у которых повышенная вирусная концентрация) [F. Ndairou et al., 2020] . Однако теоретическое определение этого явления требует моделирования в масштабе отдельных людей (АОМ, см. Раздел 4.3). Дальнейшее развитие математических моделей можно разделить на две составляющие: введение пространственной координаты в логистические уравнения и учет дискретной пространственной неоднородности. В первом случае мы получаем новый класс математических моделей «реакции-диффузии» (см. Раздел 3.3), а во втором -новый подход, в котором системы дифференциальных уравнений соединяются в пространстве графовой структурой (см. Раздел 4). В 1937 году британский ученый R.A. Fisher [R.A. Fisher, 1937] и советские математики А.Н. Колмогоров, И.Г. Петровский и Н.С. Пискунов [A.N. Kolmogorov et al., 1937] предложили и обосновали математическую модель, основанную на уравнении в частных производных параболического типа, получившую впоследствии название модели «реакции-диффузии», которая была также применена при описании процессов в биологии, экологии и других приложениях: Здесь ( , ) -вектор плотности распределения групп популяции в точке пространства и времени , -коэффициент диффузии, ( ) -функция, характеризующая характер распространения заболевания в популяции, удовлетворяющая закону сохранения масс и условиям Авторы работы [A.N. Kolmogorov et al., 1937] строго доказали, что если начальное условие удовлетворяет следующим ограничениям то динамика популяции по переменной описывается скоростью * = 2 √︀ ′ (0) . Учет пространственной неоднородности позволяет более точно моделировать эпидемию от очага распространения (крупного города в стране, столицы в регионе и пр.) при известных начальных условиях. Так, в работах [A. Viguerie et al., 2020 , V.V. Aristov et al., 2021 ,G. Bärwolff, 2021 ,Z. Lau et al., 2021 получены оценки распространения COVID-19 в первые месяцы с начала эпидемии с учетом пассажиропотоков. Показано, что учет неоднородности влияет на характер распространения COVID-19 в крупных регионах и странах. В разделе 5 будут рассмотрены стохастические дифференциальные уравнения, учитывающие пространственную неоднородность и элементы управления (задачи ИСП). Однако использование модели для описания второй и последующих волн эпидемии требует добавления уравнений в (3.3), введения множественных известных источников распространения заболевания ( , 0) (обратная задача определения источника) и вычислительных ресурсов. Использование СДУ позволяет учитывать и анализировать случайные флуктуации эпидемиологического процесса (процессы заражения, тестирования, выздоровления и др.). В работе [V.N. Kolokoltsov et al., 2012] показано, что нелинейные кинетические уравнения с мерой, описывающие динамический закон предела больших чисел для системы с большим числом агентов, разрешимы и что их решения представляют собой 1/ -равновесия по Нэшу для аппроксимирующих систем из агентов. Указанное заключение получено в предположении, что в основе динамики репрезентативных агентов лежит управляемый нелинейный марковский процесс, связанный с интегродифференциальными генераторами типа Леви-Хинчина (с переменными коэффициентами), с основным упором на приложения к устойчивым и устойчивоподобным процессам. В частности, показано, что функция управления задает нелинейный марковский процесс , порожденный семейством операторов [ , , ( , ·)], через общее кинетическое уравнение в слабой форме [Н.Г. Ван Кампен, 1990] : Более подробное описание моделей, основанных на СДУ, а также управление такими процессами приведено в Разделе 5. Известно, что плотность потока частиц в размножающей среде при достаточно широких условиях асимптотически экспоненциальна по времени с некоторым параметром , т.е. с показателем . В работах [G.Z. Lotova, G.A. Mikhailov, 2020 , G.Z. Lotova, G.A. Mikhailov, 2021 показано, что если среда случайна, то параметр -случайная величина, и для оценки временной асимптотики среднего (по реализациям среды) числа частиц можно в некотором приближении осреднять экспоненту по распределению . В предположении гауссовости этого распределения таким образом получается асимптотическая "сверхэкспоненциальная" оценка среднего потока, выражаемая экспонентой с показателем + 2 /2. Для численной экспериментальной проверки такой оценки разработано вычисление вероятностных моментов случайного параметра на основе рандомизации фурье-приближений специальных нелинейных функционалов. Отмечено, что результаты в статье имеют широкое приложение. В частности, согласно статистике ВОЗ, сверхэкспоненциальное поведение проявляла пандемия COVID-19, развивающаяся во всем мире. А именно, количество наблюдений (по дням) аппроксимируется с точностью до 2% с 9 марта 2020 года по 21 марта 2020 года. Общее определение индекса репродукции (basic reproduction number) [Википедия]: индекс репродукции вируса ℛ 0 определяется как среднее количество людей, которых заражает активный инфицированный, попавший в полностью неиммунизированное окружение при отсутствии специальных эпидемиологических мер, направленных на предотвращение распространения заболевания. В разделе 3.5.1 мы покажем, что индекс репродукции ℛ 0 является границей устойчивости состояния равновесия SIR-системы при отсутствии инфицированных. Если ℛ 0 > 1, то на начальном этапе число заболевших будет расти экспоненциально. Если ℛ 0 ∈ (0, 1), то небольшое количество инфицированных людей, попавших в полностью восприимчивую популяцию, в среднем не смогут сохранить свою группу, и эпидемии не будет. Опишем метод вычисления индекса репродукции, предложенный van den Driessche и Watmough [P. van den Driessche, J. Watmough, 2008] для SIR-моделей. Разделим всю популяцию на две категории: групп инфицированных и групп не инфицированных. Здесь ℱ -скорость изменения количества инфицированных и -скорость изменения умерших, выздоровевших и тех, кто заболевает в -й группе. Вывод индекса репродукции заключается в линеаризации системы (3.4) в окрестности состояния равновесия в случае отсутствия инфекции (0, 0 ). В работе [P. van den Driessche, J. Watmough, 2008] были введены пять условий существования этого состояния равновесия, согласованных с законом сохранения масс для модели модели (3.4) . Тогда индекс репродукции ℛ 0 = max ( −1 ) является неотрицательным и соответствующий ему собственный вектор состоит из неотрицательных компонент [A. Berman, R.J. Plemmons, 1970] . Компоненты вектора можно интерпретировать как распределение инфицированных индивидуумов, вызывающих наибольшее количество ℛ 0 вторичных инфекций в поколении. В [P. van den Driessche, J. Watmough, 2008] доказана теорема о локальной устойчивости неинфицированного состояния равновесия системы (3.4) , а именно состояние равновесия (0, 0 ) локально асимптотически устойчиво, если ℛ 0 < 1, и неустойчиво, если ℛ 0 > 1. В следующем разделе приведен вывод индекса репродукции для SEIR-HCD модели распространения COVID-19. Используя описанный алгоритм, выведем индекс репродукции для модели SEIR-HCD распространения COVID-19 [E. Unlu et al., 2020 Схема модели (3.5) приведена на Рис. 3.3в, а описание и значения параметров и начальных условий для Новосибирской области приведены в таблице 3.1 (начальный момент времени полагается 15.04.2020). В SEIR-HCD модели происходит перемещение бессимптомной популяции ( ) после дней в симптоматическую ( ). Инфицированные индивидуумы после дней выздоравливают с вероятностью и госпитализируются ( ) с вероятностью 1 − . Затем госпитализированные могут выздоравливать или нуждаться в подключении аппарата ИВЛ ( ). В модели только критические случаи могут умереть ( ) с вероятностью . Разделяя всю популяцию в модели (3.5) на инфицированных = ( , , , ) ∈ R 4 и неинфицированных = ( , , ) ∈ R 3 , получим следующие вектор-функции, согласно (3.4) : Состояние равновесия системы (3.5)-(3.6) в случае отсутствия инфицированных индивидуумов есть ( , 0, 0, 0, 0, 0, 0). Тогда матрицы и имеют вид: Вычисляя максимальное собственное значение матрицы −1 , получим индекс репродукции для SEIR-HCD модели первое слагаемое в котором характеризует заразность от бессимптомной части популяции, а второе слагаемое -от симптомной с учетом госпитализированных случаев, пребывающих на изоляции. Преимущество использования дифференциальных моделей для описания распространения эпидемий (в том числе COVID-19) состоит в учете особенностей инфекции (наличие инкубационного периода, взаимосвязь инфицированных и критических случаев и т.д.) в параметрах моделей и закона сохранения масс (размера популяции), а в случае добавления переменной (модели «реакции-диффузии») -учет пространственной неоднородности. Такие модели качественно описывают вспышку эпидемии, но не обладают достаточной гибкостью. Учет изменения параметров для описания ограничительных мер, новых мутаций вируса приводит к неединственности и неустойчивости решения задачи их идентификации. 4 Агентно-ориентированные модели В данном разделе будет приведен краткий обзор имитационных моделей, основанные на клеточных автоматах, и АОМ. Подробное построение АОМ распространения COVID-19 в конкретной регионе приведено в конце раздела 4.3.1. Значимым преимуществом моделей, базирующихся на аппарате дифференциальных уравнений, является возможность их аналитического исследования. Тем не менее для всех таких моделей характерно допущение -характеристики и поведение всех индивидов, отнесенных к одной подгруппе, считаются одинаковыми. Имитационные модели (клеточные автоматы, сетевые модели и АОМ) позволяют ослабить указанные ограничения. T.C. Shelling в 1971 [T.C. Schelling, 1971 ] и M. Mitchel в 1993 [M. Mitchell et al., 1993] предложили теорию клеточных автоматов для моделирования локальных характеристик восприимчивых популяций вместе со стохастическими параметрами, которые отражают вероятностный характер передачи болезни. Клеточные автоматы представляют собой совокупность квадратных ячеек, объединенных в прямоугольную решетку, каждая из которых принимает состояние из конечного множества. Узлы решетки моделируют индивидов, каждый из которых имеет фиксированное положение в пространстве (схема клеточного автомата представлена на Рис. 4.1a) . Так, анализ социальной дистанции, ношение масок при распространении COVID-19 в локальной популяции может описываться с помощью клеточных автоматов [P.H.T. Schimit, 2021 ]. В работе [J. Dai et al., 2021] SEIR модель описывается в терминах вероятностных клеточных автоматов и обыкновенных дифференциальных уравнений передачи COVID-19, достаточно гибких для моделирования различных сценариев социальной изоляции. Рис. 4.1: Представление распространения инфекции клеточным автоматом (а) и сетевой моделью (б). После публикации статьи P. Patrolla в 2004 году [P. Patlolla et al., 2004] была предложена АОМ, в которой расширены возможности клеточных автоматов отслеживания распространения болезни и контактов между каждым человеком в социальной группе, расположенной в географической области. АОМ позволяют взаимодействовать между людьми и способны преодолевать ограничения различных подходов, обращаясь к естественной стохастической природе эпидемического процесса. АОМ представляют схему возможных контактов в виде динамического или статического графа, в котором вершины -объекты с набором индивидуальных свойств, сколь угодно детализировано описывающие состояние отдельных индивидов (упрощенная схема графа в АОМ приведена на Рис. 4.1б) . Группа под руководством академика Г.Н. Рыкованова [V.A. Adarchenko et al., 2020 , A.I. Vlad et al., 2020 разработали и проанализировали камерную SEIR-D и АОМ для описания распространения COVID-19. Разработанная статистическая АОМ, несмотря на некоторую упрощенность модели поведения людей, позволяет расчетно анализировать такие факторы, как, например, введение карантина в отношении отдельных социальных групп или в отдельных сферах деятельности (работа, транспорт, магазины). Авторы отметили (стр. 27-28), что достоинства статистической модели влекут за собой и некоторые её недостатки. Так, чтобы достоверно моделировать те или иные факторы, в основу расчета должны закладываться адекватные исходные данные -от численности населения и его распределения по социальным группам до загруженности различных видов транспорта или магазинов. Группа американских ученых [C.C. Kerr et al., 2021] разработали программный комплекс Covasim [1] , основу которого составляет агентный подход моделирования эпидемии с учетом особенностей заболевания, фармацевтических (вакцинация) и политических (физические ограничения, ношение масок) вмешательств. Этот программный комплекс применялся для построения сценариев развития эпидемии COVID-19, изучения динамики пандемии и поддержке принятия политических решений более чем в десятке стран Африки, Азиатско-Тихоокеанского региона, Европы и Северной Америки. В статье [A. Aleta et al., 2020] показано, что система реагирования, основанная на расширенном тестировании и отслеживании контактов, может играть важную роль в ослаблении интервенций социального дистанцирования при отсутствии коллективного иммунитета против SARS-CoV-2. Авторы [M.S.Y. Lau et al., 2020] подсчитали, что инфицированные люди не пожилого возраста (<60 лет) могут быть в 2,78 раза более заразными, чем пожилые люди, и первые, как правило, являются основной движущей силой сверхраспространения. В работах [A.J. Kucharski et al., 2020 , N. Hoertel et al., 2020 ,J. Hellewell et al., 2020 в рамках АОМ распространения COVID-19 проанализированы противоэпидемические программы в различных регионах, в результате чего получено понимание эффективных мер для разных географических и демографических условий, а также текущих штаммов SARS-CoV-2. В работе [B.F. Nielsen, K. Sneppen, 2020] авторы построили АОМ, в котором источники заражения выступали суперраспространители. Они показали, что сверхраспространение резко усиливает значимость ограничений личных контактов. В следующем разделе подробно описан процесс построения популяции на основе пакета Covasim, инфицирования вирусом штамма SARS-CoV-2 на основе графов, тестирования и вакцинации в Российской Федерации на основе статистических данных. Опишем структуру АОМ, лежащую в основе пакета Covasim [1]: 1. Инициация популяции. Формируются четыре структуры контактов: домохозяйства, образовательные учреждения, рабочие и общественные места. (a) Постоянные характеристики агента: • возраст (все агенты делятся на возрастные группы по 10 лет: 0-9 лет, 10-19, . . . , 80+), • пол, • социальный статус, • вероятности прогрессирования заболевания зависят от возраста агента (возникновения симптомов, тяжелых и критических случаев, смертность). (b) Переменные характеристики агента (пересчитываются к концу дня -шаг по времени): • эпидемиологический статус. Каждый агент в определенный момент времени может находиться в одной 9 стадиях заболевания: к описанным в Разделе 3.5.2 состояниям , , , , , , добавлены бессимптомные больные и больные в легкой форме , • шанс быть протестированным. Домохозяйства заполняются агентами согласно статистическим данным ООН [2] о среднем размере семьи в регионе (2.6 человек). В зависимости от возраста агенты контактируют друг с другом в контактных сетях, представляющие собой полносвязные графы, количество вершин которых является пуассоновской случайной величиной с средним: • для домохозяйства -размер семьи, • для общественных мест и образовательных учреждений -20. • для работы -8. Все агенты имеют контакты в домохозяйствах и в общественных местах, агенты в возрасте 6-21 лет также могут контактировать в образовательных учреждениях с агентами своего возраста, агенты в возрасте 22-65 лет -на работе. Пример графов в разных структурах контактов в АОМ приведен на Рис. 4.2. 2. Заражение. В рамках модели предполагается, что вирус передается между агентами, соединенными ребром графа. Заражение при близком контакте описывается кусочно-постоянным параметром ( ). В зависимости от структуры контакта, параметр умножается на соответствующую константу (для домохозяйств = 3, для образовательных учреждений и работы = 0.6, для общественных мест = 0.3). Таким образом, вероятность передачи вируса для каждой контактной сети различная. Симптомные и бессимптомные агенты передают вирус одинаково. 3. Прогрессирование заболевания. Переход из одной стадии заболевания , , , , , , , , в другую в момент времени контролируется параметрами, зависящими от возраста, т.е. чем старше агент, тем он более уязвим (например, вероятность проявлять симптомы после заражения = 0.5 + 0.05 ∈ [0.5, 0.9], где -номер возрастной группы). Взаимосвязь эпидемиологических состояний обозначена на Рис. 4.3 . Продолжительность каждой стадии заболевания представляет собой случайную логнормальную величину с различными средними и параметрами дисперсии (см. Таблицу 4.1). Модель основана на нескольких предположениях: Образовательные учреждения Рабочие места Рис. 4.2: Пример схем связей для подвыборки 127 человек из 10 000. Все люди присутствуют в домохозяйствах (слева), в том числе некоторые не имеют связи с домом. Как правило, эти люди, включая учителей, присутствуют в школьной сети (кружки); другое подмножество присутствует в сетях рабочих мест (квадраты); некоторые люди не входят ни в школьную, ни в рабочую сеть (треугольники). Цветом отмечена возрастная категория агента. Параметр Описание Распределение Количество дней с момента контакта до того, как агент станет заразным. LogN (4.6, 4.8) [S. A. Lauer et al., 2020] Количество дней с момента, когда агент стал заразен, до проявления симптомов. LogN (14, 2.4) [R. Verity et al., 2020] Количество дней, за которое агент переходит из легкого состояния в тяжелое. LogN (6.6, 4.9) [S. A. Lauer et al., 2020] ℎ Количество дней, за которое агент переходит из тяжелого состояния в критическое. LogN (3, 7.4) [D. Wang et al., 2020] Длительность пребывания агента в критическом состоянии. 4. Тестирование агентов проводится согласно ежедневным статистическим данным о количестве проведенных тестов в регионе. Шанс быть протестированным на COVID-19 ( , ) зависит от эпидемиологического статуса агента и определяется в ходе решения обратной задачи (см. Раздел 6.2.2). Положительный результат могут получить агенты, находящиеся в симптомном, бессимптомном, в легкой форме, госпитализированном, критическом состояниях (на рис. 4.3 эти состояния обведены в оранжевую рамку). В модели предполагается, что вероятность тестирования агентов с симптомами выше, чем у бессимптомных больных. Введение сдерживающих эпидемию мер. В модели возможно введение карантинных мер как для всех контактных слоев, так и для каждого в отдельности. Это может быть сделано двумя способами: либо изменением значения параметра ( ) (в случае введения обязательной меры ношения масок или социального дистанцирования), либо удалением ребер в графах (в случае введения самоизоляции и дистанционной работы). Загружаются все необходимые параметры и статистические данные, создается искусственная популяция с учетом распределения по возрастам в регионе. Далее агенты соединяются в контактные сети. Затем начинается цикл по времени: на каждом шаге (временной интервал равен одному дню) обновляется эпидемиологический статус агента с учетом его структуры контактов и введенных ограничительных мер (самоизоляция, закрытие общественных мест, ношение масок и т.д.). В АОМ индекс репродукции вируса ℛ 0 определяется следующим образом: Здесь ( ) -количество новых случаев инфицирования в день , ( ) -количество людей с активным инфекционным заболеванием в день , -среднее время инфицирования. АОМ позволяют преодолевать ограничения дифференциальных моделей, используя стохастическую природу эпидемического процесса, возможности введения ограничительных мер в модель, особенности моделируемого региона и учета индивидуальности индивидуума (агента). На основе результатов моделирования в рамках АОМ получено понимание эффективности мер для разных географических и демографических условий для каждого выявленного штамма SARS-CoV-2. Для повышения достоверности результатов необходимо использовать адекватные статистические данные (эпидемиологические, демографические, транспортные), уточнять границы чувствительных параметров моделей, иметь большие вычислительные мощности для реализации моделирования и прогнозирования. В данном разделе приведено описание комбинации SIR-модели (с учетом пространственной неоднородности) и агентной модели. Распределение агентов в пространственной SIR-модели описывается уравнением Колмогорова-Фоккера-Планка (5.10) (Раздел 5.2), а управление агентов описывается уравнением Гамильтона-Якоби-Беллмана (5.15) (Раздел 5.3). Совместное рассмотрение КФП и ГЯБ образуют систему уравнений ИСП (Раздел 5.4). предложили и обосновали концепцию ИСП, которая используется в физике, экономике, метеорологии, социальных и биологических процессах. Основные задачи, которые рассматриваются в теории ИСП: -исследование существования и единственности решения ИСП, при этом ИСП формализуется в виде системы двух уравнений в частных производных первого порядка и задачи управления для некоторой динамической системы, используемая для выводя уравнения ГЯБ, соответствующего модели поведения агентов (подробнее см. Раздел 5.4); -построение приближенного равновесия в игре конечного числа агентов; -исследование сходимости приближенных равновесий в играх конечного числа лиц к решению ИСП при стремлении числа игроков к бесконечности; -анализ конкретных эпидемиологических задач при помощи методологии ИСП. В работе [В.Н. Колокольцов и др., 2013] исследуется сходимость решений для игр с нелинейными процессами устойчивого типа с переменными коэффициентами. Концепция ИСП находится на пересечении теории среднего поля и нелинейного марковского управления [D. Andersson, B. Djehiche, 2011 , R. Buckdahn et al., 2009 С 2015 года опубликовано множество работ, использующих ИСП для описания эпидемических процессов распространения гриппа, ОРВИ, СOVID-19 [L. Laguzet, G. Turinici, 2015 , W. Lee et al., 2020a , H. Tembine, 2020 , W. Lee et al., 2020b ]. Рассмотрим однородные марковские случайные процессы в R , для которых оператор переходных вероятностей задаётся переходной плотностью ( , , ). Зададим оператор Q, действующий на функцию ( ) в R : В случае, когда Q -дифференциальный оператор второго порядка с непрерывными коэффициентами (это означает, что ( , ) есть линейная комбинация первых и вторых производных ( − ) с непрерывными коэффициентами), а матрица коэффициентов перед вторыми производными является симметричной и положительно определенной в каждой точке, то уравнение Колмогорова будет совпадать с уравнением Фоккера-Планка [Н.Н. Боголюбов, Н.М. Крылов, 1939] : Вектор в физической литературе называется вектором сноса, а матрица -тензором диффузии. Уравнение КФП (5.1) используется для расчёта плотности вероятности в СДУ: Здесь X ∈ R -функция состояния системы, а B ∈ R -стандартное -мерное броуновское движение. В нашем случае вектор X описывает состояния агентов в каждой из камер и является решением системы (5.2) . Более подробно см. систему (5.5) . Если начальное распределение задано как X 0 ∼ (0, x), то плотность вероятности ( , x) состояния системы X является решением уравнения КФП (5.1). Уравнение ГЯБ -дифференциальное уравнение в частных производных, играющее центральную роль в теории оптимального управления. Рассмотрим задачу оптимального управления на промежутке времени Неизвестная в этом уравнении беллмановская функция значения ( , ), отвечающая максимальному значению, которое можно получить, ведя систему из состояния ( , ) оптимальным образом до момента времени . Тогда оптимальное решение в начальный момент времени -значение = ( (0), 0). Уравнение (5.3) называется уравнением Беллмана [R.E. Bellman, 1957] , также известное как уравнение динамического программирования. Также Беллманом было введено понятие принципа оптимальности: оптимальная стратегия имеет свойство, что какими бы ни были начальное состояние и начальное решение, последующие решения должны составлять оптимальный курс действий по отношению к состоянию, полученному в результате первого решения. Иными словами, оптимальная стратегия зависит только от текущего состояния и цели, и не зависит от предыстории. При рассмотрении задачи с непрерывным временем полученные уравнения могут рассматриваться как продолжение более ранних работ в области теоретической механики, связанных с уравнением Гамильтона-Якоби. Предположение, что агенты в популяции рациональны (то есть обладают способностью находиться в состоянии ( ) и иметь возможность его изменить), позволяет рассматривать задачу управления с большим количеством участников. Динамика отдельного индивидуума удовлетворяет дифференциальному уравнению Ито ) ( ). Здесь ∈ 1, .., , -независимые стандартные винеровские процессы, ( , ( )) -стратегия −го агента и ( , ( )) -эмпирическая мера распределения агентов в системе в момент времени [M. Fischer, 2017] . В предположении, что функции и непрерывны во времени и одинаковы для всех агентов, в работе [M. Fischer, 2017] показано, что когда количество агентов в системе чрезвычайно велико → ∞, мы можем заменить массу отдельных индивидов репрезентативным агентом, состояние которого определяется следующим уравнением ( ) = ( , ( ), ( ), ( , ( ))) + ( , ( ), ( , ( ))) ( ). →∞ → ( , ( )) -это распределение агента по пространству состояний Ω в момент времени и ( , ( )) -стратегия репрезентативного агента, обеспечивающая равновесие по Нэшу системы взаимодействующих агентов (ни один агент не может увеличить выигрыш, изменив свою стратегию, если другие агенты своих стратегий не меняют) и минимизирующая функционал Данный подход к контролю над популяцией с большим количеством взаимодействующих агентов получил название ИСП [J.-M. Lasry, P.-L. Lions, 2007 , A. Bensoussan et al., 2013 , M. Fischer, 2017 . Модель ИСП предполагает, что каждый агент выбирает свою рациональную стратегию ( , ) с учетом своего положения и распределения ( , ) : [0, ] × Ω → R других агентов. В работе [A. Bensoussan et al., 2013] было показано, что при постоянном в уравнении (5.5) , характеризующем стохастический характер равновесия процесса взаимодействия агентов, распределение агентов ( , ) подчиняется уравнению КФП Классическая модель ИСП в схематичном виде изображена на Рис. 5.1. Исследованы модели с динамикой каждого игрока, задаваемой марковской цепью с непрерывным временем и конечным числом состояний [D. Gomes et al., 2013] , а также марковским процессом общего вида [V.V. Kolokoltsov et al., 2011 , V.V. Kolokoltsov, W. Yang, 2013 . В этом случае уравнение (5.7) и ГЯБ заменяются на специально построенные задачи оптимизации. Альтернативный подход к ИСП называется вероятностным и связан с исследованием задачи управления для динамической системы, описываемой нелинейным марковским процессом. В этом случае динамика и интегральная часть выигрыша зависят от распределения игроков в текущий момент времени. Распределение игроков определяется по решению задачи оптимизации [R. Carmona, F. Delarue, 2013] . Недостатком вероятностного подхода является зависимость определения решения от выбора сопутствующего вероятностного пространства. Этот недостаток пытается преодолеть минимаксный подход, в рамках которого задача поиска решения ИСП сводится к решению игры бесконечного числа лиц, при этом динамика определяется распределением оптимальных траекторий. ИСП достаточно гибки, чтобы улавливать межклассовое взаимодействие при распространении эпидемии, при котором несколько органов власти осведомлены о рисках лиц, принимающих локальные решения, а отдельные лица осведомлены о рисках агентов (государство, региональное правительство), принимающих глобальные решения [H. Tembine, 2020 , W. Lee et al., 2020b . В следующих разделах приведены уравнения КФП и ГЯБ для описания распределения и управления SIR-модели распространения эпидемии. Для достаточно больших ( → ∞) популяций SIR-модель можно интерпретировать как приближение среднего поля вероятностной модели клеточного автомата [L. Berec, 2002 , P.H.T. Schimit, L.H.A. Monteiro, 2009 . Запишем аналог начально-краевой задачи для уравнения КФП (5.7)-(5.9) в случае SIR-модели (3.1) . Введем плотность ( Начальные условия 0 совпадают с плотностью нормального распределения со средним, демонстрирующим склонность соблюдать физическую дистанцию, и дисперсией, описывающей строгость соблюдения ограничений. Например, восприимчивая популяция не склонна соблюдать ограничения, поэтому среднее в распределении сместится к 1, а инфицированная , наоборот, стремится соблюдать ограничения и карантин. Отметим, что система (5.10) удовлетворяет закону сохранения масс, а именно Определим целевой функционал (5.6) следующим образом [W. Lee et al., 2020a] : Здесь и неотрицательные константы. Первое слагаемое, характеризующее кинетическую энергию, описывает цену перемещения агентов со скоростью за весь промежуток времени [0, ]. Чем выше значение , тем более затратно агентам перемещаться между группами (например, = = 1, = 10 означает, что агентам из инфицированной группы труднее передвигаться). Второе слагаемое в (5.13) контролирует скопление всего населения в одном месте. Это может повысить риск вспышек заболевания и их более быстрого и широкого распространения. Для вывода оптимальной стратегии воспользуемся методом множителя Лагранжа [A. Bensoussan et al., 2013] . Введем произвольные гладкие функции ( , ) ∈ ∞ ([0, ] × [0, 1]), ∈ { , , }, и запишем минимаксную задачу для функционала Лагранжа: 14) где функционал Лагранжа составлен из целевого функционала (5.13) и уравнений КФП (5.10), домноженных на функции ( , ) и проинтегрированных по и : Применяя интегрирование по частям и пользуясь условиями оптимальности Каруша-Куна-Таккера, получаем систему уравнения ГЯБ для оптимального управления системой агентов (5.10) : Модели ИСП описания распространения эпидемий включают в себя классические SIR-модели с учетом произвольной пространственной неоднородности (для областей с любой геометрией), а также учитывают рациональность агентов и внешнее управление (а именно, правительство может наложить ограничения на взаимодействие для разных классов населения в зависимости от их статуса заражения). С другой стороны, модели ИСП являются предельным случаем АОМ и оптимизируют вычислительные затраты. Как и для рассмотренных ранее моделей, коэффициенты уравнений, описывающие эпидемиологические характеристики моделируемого заболевания и особенности популяции, неизвестны. Необходимо формулировать обратную задачу для модели ИСП с целью уточнения чувствительных параметров и увеличения качества прогнозирования. Математические модели в эпидемиологии характеризуются своими коэффициентами и начальными условиями, которые индивидуальны для каждой моделируемой популяции. В следующих разделах будут приведены алгоритмы, входящие в комплекс программ COVID-19 моделирования распространения коронавирусной инфекции в Новосибирской области. В Разделе 6.1 приведены алгоритмы численного решения прямых задач, в которых при заданных эпидемиологических параметрах и начальных условиях требуется определить распределение различных категорий населения (восприимчивые, инфицированные, госпитализированные, вылеченные и т.п.) в течение всего времени моделирования. В Разделе 6.2 описываются алгоритмы численного решения обратных задач, в которых требуется определить неизвестные параметры моделей по дополнительной информации о количестве выявленных инфицированных, протестированных, госпитализированных и умерших в фиксированные моменты времени. Прямая задача для модели эпидемиологии состоит в определении количества или плотности восприимчивой, протестированной, инфицированной, госпитализированной и т.п. групп населения по заданным эпидемиологическим коэффициентам и начальным условиям. Численные методы решения прямых задач для математических моделей, основанных на дифференциальных уравнениях (Раздел 3), характеризуются конечноразностной структурой (методы Эйлера, конечных разностей, элементов, объемов). Полученное численное решение чувствительно к разбиению области моделирования (по времени, по пространству и времени). Обзор численных методов решения задач игр среднего поля приведен в работах [Y. Achdou, I. Capuzzo-Dolcetta, 2010 , Y. Achdou, 2013 , V.V. Shaydurov, 2020 . В комплексе программ COVID-19 для численного решения прямых задач использованы: • для моделей SIRC r и SEIR-HCD: метод Рунге-Кутты 4-го порядка. • для агентных моделей: методы графов, Монте-Карло и программные комплексы Covasim [C.C. Kerr et al., 2021] . • для моделей ИСП: метод конечных разностей дробных шагов, конечных объемов. Параметры моделей в эпидемиологии (индекс репродукции вируса ℛ 0 ( ), вероятность госпитализации, тестирования, выздоровления, количество бессимптомных носителей и т.п.) заданы приближенно и нуждаются в уточнении в каждом конкретном регионе для увеличения точности моделирования и прогнозирования распространения эпидемии. С этой целью мы решаем обратную задачу, которая состоит в определении вектора неизвестных параметров q математической модели эпидемиологии по дополнительной информации о количестве выявленных ( = 1), госпитализированных ( = 2), умерших ( = 3) в фиксированные моменты времени , = 1, . . . , (подробнее о постановке обратной задач для моделей SEIR-HCD и АОМ см. Разделы 6.2.1 и 6.2.2 соответственно). Обратная задача может быть сформулирована в виде задачи минимизации целевого функционала [B. Kaltenbacher et al., 2008 , S. Kabanikhin, 2009 : , ℐ -множество измеряемых состояний системы. Обратная задача является некорректной, а именно ее решение может быть неединственным и/или неустойчивым [А.Н. Тихонов, А.В. Гончарский и др., 1983 [А.Н. Тихонов, А.В. Гончарский и др., , А.Н. Тихонов, А.С. Леонов и др., 1995 [А.Н. Тихонов, А.В. Гончарский и др., , S. Kabanikhin, 2009 . Для разработки алгоритма регуляризации решения обратной задачи проводится анализ чувствительности параметров, который позволяет упорядочить параметры по степени чувствительности по отношению к вариации данных обратной задачи [M. Hongyu et al., 2011 , B.M. Adams, H.T. Banks et. al, 2015 ,I. Andrianakis, I.R. Vernon et. al, 2015 ,O.I. Krivorotko, D.V. Andornaya et. al, 2020 . В комплексе программ SBRAS-COVID-19 для численного решения обратных задач использованы: • Поиск глобального минимума функционала: генетический алгоритм, метод дифференциальной эволюции, метод имитации отжига, метод роя частиц, метод древовидных оценок Парзена, тензорная оптимизация, стохастический градиентный спуск, глубокие нейронные сети, обучение с подкреплением. • Для уточнения минимума: методы минимальных ошибок, наискорейшего спуска, Левенберга-Марквардта, Бройдена-Флетчера-Гофбардто-Шанно, Нелдера-Мида. Для исследования прямых и обратных задач программного комплекса SBRAS-COVID-19 использованы теоретические результаты: 1. SIR-модели: • Теория нелинейных операторных уравнений Вольтерра в банаховых и гильбертовых пространствах -локальная корректность, корректность в окрестности точного решения, единственность и условная устойчивость, сходимость дискретных аналогов к точному решению [ссылка на статью в ЖВМиМФ]. • Устойчивость обратных задач -А.Н. Тихонов [А.Н. Тихонов, 1943] 2. Агентные модели: • Методы анализа чувствительности -баесовский подоход, регрессионный анализ [I. Andrianakis, I.R. Vernon et. al, 2015 , O.I. Krivorotko, M.I. Sosnovskaia et al., 2021 . • Методы высокопроизводительных вычислений -распределенные вычисления, MPI. Предположим, что известна дополнительная информация о количестве симптомных выявленных случаях (1 − )ℎ , критических и умерших в SEIR-HCD модели в фиксированные моменты времени , = 1, . . . , : Здесь q = ( ( ), ( ), , , 0 , 0 ) -вектор неизвестных параметров модели, ℎколичество выявленных случаев в Новосибирской области (см. Рис. A.1 в Приложении A), -процент бессимптомных случаев по результатам ПЦР. Обратная задача для SEIR-HCD модели (3.5)-(3.6), (6.2) состоит в определении вектора параметров q по дополнительной информации (6.2) . Обратная задача для SEIR-HCD модели была сведена к задаче минимизации целевого функционала Здесь первое слагаемое −1 ( −1 ; q) описывает количество бессимптомных носителей вируса COVID-19, которые в день попадают в состояние выявленных симптомных инфицированных (см. Рис. 3.3в). В функционал (q) также включена информация о критических ( ; q) и умерших ( ; q) в результате СOVID-19 случаев, информация о которых доступна в открытых источниках (см. Приложение A). Анализ идентифицируемости модели (3.5)-(3.6), (6.2) показал, что параметр , описывающий долю инфицированных индивидуумов, которые переносят заболевание без осложнений, является наименее идентифицируемым [O.I. Krivorotko, S.I. Kabanikhin et al., 2021] , поэтому в качестве дополнительной информации использованы данные медицинского центра «Инвитро» (см. Приложение A), которые в полтора раза повысили устойчивость решения обратной задачи. Для численного решения задачи минимизации (q) (6.3) использовалась следующая последовательность шагов: 1. Подготовка и обработка реальных данных для вычисления обратной задачи: 2. Определение границ параметров для искомого вектора q (см. Таблицу 3.1, колонку 3). 3. Уточнение вектора неизвестных параметров q путём решения обратной задачи алгоритмом усвоения данных. Обратная задача решается для каждого 30-дневного отрезка реальных данных (тренировочные данные). Далее, по восстановленным параметрам q для текущего 30-дневного отрезка осуществляется прогноз эпидемиологических данных на следующие 7 дней (валидационные данные). Прогноз осуществляется путём решения прямой задачи (3.5.2) по схеме, указанной на рис. 6.1 для постоянного набора восстановленных на последнем временном промежутке параметров q. Далее новые тренировочный и валидационный периоды смещаются на 7 дней и для этих периодов решается новая обратная задача. И так далее до тех пор пока не закончатся реальные данные. Рис. 6.1: Алгоритм усвоения данных при решении обратной задачи для SEIR-HCD модели (3.5)-(3.6), (6.2) . Тренировочный период (30 дней) -уточнение параметров q. Прогноз (7 дней) рассчитывается при найденных q. Новый период сдвигается на 7 дней и снова решается обратная задача. 3.1. Для решения задачи минимизации целевого функционала (6.3) использовался пакет глобальной оптимизации OPTUNA, в реализации которого лежат природоподобные алгоритмы, метод древовидных оценок Парзена и тензорная оптимизация. 3.2. Полученный на предыдущем шаге глобальный оптимум уточнялся с помощью локальных методов градиентного типа . Предположим, что для АОМ, описанной в разделе 4.3.1, известна дополнительная информация о количестве ежедневно выявленных случаев ℎ , проведенных ПЦРтестов в регионе ( ), критических и умерших случаев в фиксированные моменты времени , = 1, . . . , . Обратная задача для модели АОМ состоит в определении вектора параметров q = ( , ( ), ( ), ( ), 0 ) по дополнительной информации ℎ , ( ), , , = 1, . . . , . Здесь -параметр контагиозности вируса, ( ) -дни изменения параметра , ( ) -значения, на которые изменяется параметр в дни ( ), ( ) -шанс быть протестированным (зависит от возрастной группы), 0 -начальное количество бессимптомных инфицированных. Обратная задача сводится к задаче минимизации целевого функционала: Здесь ( ; q) -количество моделируемых выявленных случаев COVID-19 в результате ПЦР тестирования. Была исследована идентифицируемость агентной модели на основе байесовского подхода [I. Andrianakis, I.R. Vernon et. al, 2015] с тремя неизвестными параметрами: параметр контагиозности , начальное количество инфицированных 0 и параметр тестирования по статистическим данным о количестве выявленных ℎ , смертей в результате COVID-19 и пациентов, находящихся в отделении интенсивной терапии . В результате удалось уменьшить границы поиска параметра более чем в 2 раза, в то время как границы параметров и 0 остались неизменными. Алгоритм численного решения задачи минимизации функционала (q) (6.4): 1. Подготовка и обработка реальных данных для вычисления обратной задачи (файлы с данными доступны на сайте http://covid19-modeling.ru/ в разделе "Данные"): 1.1. Заполнение пропусков в данных о ежедневно выявленных случаев, проведенных ПЦР-тестов, критических и умерших методами обратной и прямой экстраполяции. 1.2. Сглаживание данных с помощью Гауссовского фильтра [4] для уменьшения флуктуации данных перед использованием их в решении обратной задачи. 2. Уточнение границ изменения неизвестных параметров q методами анализа чувствительности. 3. Поэтапное восстановление вектора параметров q с шагом 30 дней, в ходе которого значения кусочно-постоянного параметра ( ( ), ( )) находились последовательно один за другим. Таким образом, значения параметров, восстановленные на предыдущем шаге, использовались в последующем запуске алгоритма минимизации функционала, который представлял собой комбинацию методов глобального (библиотека OPTUNA) и локального (градиентные) метода оптимизации. 5.1. Решаем прямую задачу с идентифицированными параметрами 10000 раз с помощью метода Монте-Карло (вычислительное время решения прямой задачи для АОМ на кластере составляет 10 сек). 5.2. Для каждого дня считаем квантили уровня 0.1, 0.5, 0.9 (строим функцию распределения случайной величины выявленных случаев и выбираем ее значения в точках 0.1, 0.5 и 0.9). 5.3. Получаем 3 массива точек с шагом один день, по которым строим медианное значение (квантиль уровня 0.5, сплошная линия на графиках в Разделе 7.1). В данном разделе будет проведен анализ численных расчетов для АОМ и SEIR-HCD модели в Новосибирской области (Раздел 7.1), влияние социальной дистанции на распространение эпидемии в Новосибирской области на основе ИСП (Раздел 7.2), выводы (Раздел 7.3) и направления дальнейшей работы (Раздел 7.4). Численные расчеты данного раздела приведены для Новосибирской области. Данные, использованные при анализе и построении моделей, описаны в Приложении A. В Табл. 7.1 приводятся восстановленные параметры (АОМ) и , , , (SEIR-HCD), характеризующие распространение COVID-19 в Новосибирской области. Дата изменения ( ) параметров (результат решения обратной задачи для АОМ, см. Раздел 6.2.2) коррелируют с ограничительными мерами, принятыми в регионе (с интервалом 5-14 дней). Например, возобновление удаленного режима с 1 ноября 2020 года в учебных заведениях повлекло уменьшение значений параметра контагиозности в структурах с 14 ноября 2020 года. В последней колонке Табл. 7.1 приведены 95% доверительные интервалы (95% CI) полученных значений, вычисленные по 30 испытаниям оптимизационного алгоритма OPTUNA. В АОМ параметр контагиозности вируса ( ) имеет различные значения для каждой структуры контактов (домохозяйства, образовательные учреждения, работа и общественные места). В SEIR-HCD модели восстановленные значения параметров являются усредненными в регионе, так как разделения на структуры контактов не подразумевалось. Для анализа эффективности ограничительных мер были изучены следующие сценарии распространения ежедневно выявленных случаев COVID-19 (рис. 7.2): • Нерабочие дни с 30.10 по 07.11, в течение которых уменьшается на 40% людей на работе и учебе, потом увеличивается заболеваемость из-за привезенных случаев в 2 раза -синяя линия; • Локдаун с 30. 10.2021 по 14.11 .2021, в течение которого полностью закрыты образовательные учреждения, 50% общественных мест и 50% рабочих переведены на удаленный режим работы -красная линия; • Ничего не предпринимать (базовый сценарий) -зеленая линия. Результаты численных расчетов для сценариев развития представлены на рисунке 7.2. Так, введенная мера о нерабочих днях (синяя линия) может привести к самому неблагоприятному сценарию развития ситуации, при которой к 8 ноября ожидается 416 выявленных случаев. Базовый сценарий развития (зеленая линия) предполагает 356 выявленных случаев к 8 ноября, в рамках которого количество людей в общественных местах уменьшится из-за введения QR-кодов. Наиболее оптимистичный сценарий стоит ждать в случае более серьезного локдауна (красная линия), при котором к 8 ноября ожидается 349 выявленных случаев. Для каждого из сценариев были проведены расчеты индекса репродукции вируса ℛ 0 для АОМ, описанного в разделе 3.5. Результаты численных расчетов представлены на рис. 7.3. В случае сценария «объявления нерабочей недели» индекс репродукции ожидается наибольшим по значению, что впоследствии может привести к повышенному числу выявленных и умерших случаев, а также нагрузку на систему здравоохранения (синяя линия). Более серьезные ограничения до 14.11 (красная линия) значительно уменьшат значение индекса репродукции, однако через 2 недели он снова может увеличиться и переступить порог в 1. Базовый сценарий развития (черная линия) к 30 ноября предполагает стабильную ситуацию в регионе. На основе SIR-модели была введена модель SIRC r [R. Casagrandi, L. Bolzoni et al., 2021] , в которой ( ) -группа населения, имеющая перекрестный иммунитет (т.е. иммунную память к коронавирусу): Таблица 7.2 : Эпидемиологические параметры для SIRC r модели (7.1) для Новосибирской области с 01.05.2020 по 08.08.2020, полученные с помощью решения обратной задачи. Численные расчеты данного раздела основываются на работе [V. Petrakova, O. Krivorotko, 2021] . Для сведения модели (7.1) к модели ИСП (см. Раздел 5.4) вместо численности населения в каждой группе ( ), ( ), ( ), ( ) введем плотность распределения людей внутри этих групп ( , ), ( , ), ( , ), ( , ). Переменная изменяется в пределах [0,1] и означает соблюдение карантинных мер: = 1 означает, что человек полностью придерживается карантинных ограничений, включая вакцинирование, а = 0 означает, что он не придерживается никаких ограничений. Введем функции ( , ), ( , ), ( , ), ( , ), обозначающие изменение состояния человека в шкале соблюдения карантинных мер, вызываемое окружающей обстановкой, воздействием СМИ, вакцинацией и организационными мероприятиями. Тогда уравнения КФП (5.7)-(5.9) примут вид: ) )︁ . (7.5) Здесь˜( , , ( , )) -стоимость проводимых организационных мероприятий: вакцинация, карантинные мероприятия, введение QR-кодов и другие, ( , , ( , ))стоимость социальных и экономических потерь для группы населения в позиции на момент времени , = ( , , , ), = ( , , , ). Минимум функционала ( , ) (7.5) при выполнении уравнений КФП определяется методом множителей Лагранжа ( , ), ( , ), ( , ), ( , ), которые удовлетворяют системе ГЯБ типа (5.3) : из которых определяются параметры , , , , отражающие текущее изменение позиций групп населения по отношению к соблюдению карантинных мер. Решение задач для уравнений КФП (7.2)-(7.4) и ГЯБ (7.6) совместно с уравнением связи 7.7 дает решение задачи оптимального поведения агентов при эпидемии с указанием строгости мер или возможности ослабления карантинных ограничений. На рис. 7.4 приведено сравнение результатов моделирования числа инфицированного населения для моделей SIRC r (7.1) и ИСП (уравнения КФП и ГЯБ) со статистическими данными в течение 100 дней с 1 мая по 8 августа 2020 года в Новосибирской области. Рис. 7.4 : Сравнение результатов моделирования числа выявленных случаев COVID-19 в Новосибирской области со статистическими данными с 01.05.2020 по 08.08.2020. Сплошная линия -статистические данные, пунктирная линия -SIRC r модель, линия с треугольниками -ИСП модель. Сочетание моделей SIR и АОМ позволяет строить более разнообразные сценарии распространения пандемии COVID-19. А именно, используя результаты решения обратной задачи SEIR-HCD модели как дополнительную информацию для АОМ, мы уточняем сценарии с учетом ограничительных мер с помощью АОМ. Рассчитанные сценарии используются как дополнительная информации для дальнейшего уточнения параметров SEIR-HCD модели. Также можно перевести на материалистический язык разные с содержательной точки зрения сценарии и сравнить их. При усложнении SIR-модели, вводя возрастные разграничения в популяции и пространственные перемещения, мы получим первое приближение АОМ. Для более точных рекомендаций поддержки принятия решений и более комплексного моделирования мы применяем подход ИСП и ИСПУ (управление играми среднего поля, mean-field-type control). А именно, влияние вакцинации, характеризующее социальные настроения в регионе, учитывается при построении распределений населения в эпидемиологических группах. История заболевания (временные ряды эпидемиологических данных) составляет обучающие множества для методов машинного обучения. Необходимо совершенствовать методы искусственного интеллекта в приложении к моделированию COVID-19 и расчетов сценариев выхода из пандемии с учетом социальных, экономических и экологических процессов, включая анализ ситуации в различных регионах и группах, обработку данных, а также создавать комплексную модель на основе SIR, АОМ и ИСП (ИСПУ). Работа выполнена при поддержке Математического Центра в Академгородке, соглашение с Министерством науки и высшего образования Российской Федерации № 075-15-2019-1675, Российского научного фонда (проект № 18-71-10044) и Российского фонда фундаментальных исследований (проект № 20-51-54004). • Мэрии города Новосибирска на предоставление грантов в форме субсидий в сфере научной и инновационной деятельности 2021; • Министерства образования Республики Казахстан (№ ИРН AP09260317). Авторы признательны всем своим коллегам, с которыми неоднократно обсуждали вопросы и проблемы, изложенные в данной работе: Для более полного анализа и последующего построения более точных сценариев развития эпидемиологической ситуации в регионе необходим анализ следующих данных, которые не публикуются в открытых источниках: • Информация о количестве завезенных случаев COVID-19 (из других регионов РФ или из-за границы); • Информация о доле больничных коек, занятых больными COVID-19, от всех доступных в учреждениях здравоохранения; • Определение штамма вируса при выявлении заражения (см. Табл. A.3); • Идентификация суперраспространителей COVID-19 при проведении тестирования. Методы прогнозирования и модели распространения заболеваний Балансовая модель эпидемии COVID-19 на основе процентного прироста. Информатика и автоматизация Automated time series forecasting for biosurveillance Methods for current statistical analysis of excess pneumonia-influenza deaths Анализ временных рядов: прогноз и управление Modelling and forecasting of rainfall time series using SARIMA An analysis of transformations. (With discussion) Adaptive Holt-Winters forecasting A Bayesian dynamic model for influenza surveillance Monitoring epidemiologic surveillance data using hidden Markov models Neural network powered COVID-19 spread forecasting model Current and potential statistical methods for monitoring multiple data streams for biosurveillance Exponential smoothing: the state of the art Essai d'une nouvelle analyse de la mortalité causée par la petite vérole et des avantages de l'inoculation pour la prévenir. Mem. Math. and Phys. de l'Acad A Short History of Mathematical Population Dynamics Mathematical epidemiology: Past, present, and future The Prevention of Malaria Undamped oscillations derived from the law of mass action Fluctuations in the abundance of a species considered mathematically Applications of mathematics to medical problems A contribution to the mathematical theory of epidemics Logistic equation and COVID-19 Prediction of epidemic trends in COVID-19 with logistic model and machine learning technics Mathematical modeling of the spread of COVID-19 in Moscow A time delay dynamical model for outbreak of 2019-nCoV and the parameter identification COVID-19 in Moscow: prognoses and scenarios Epidemic analysis of COVID-19 Outbreak and Counter-Measures in France Mathematical modeling and forecasting of COVID-19 in Moscow and Novosibirsk region Simulation modelling application for balancing epidemic and economic crisis in the region Mathematical modeling of the transmission of SARS-CoV-2-Evaluating the impact of isolation in São Paulo State (Brazil) and lockdown in Spain associated with protective measures on the epidemic of CoViD-19 Mathematical and computer modeling of COVID-19 transmission dynamics in Bulgaria by time-depended inverse SEIR model Optimal control of the COVID-19 pandemic: controlled sanitary deconfinement in Portugal Mathematical modeling of COVID-19 transmission dynamics with a case study of Wuhan A delay differential equation approach to model the COVID-19 pandemic The wave of advance of advantageous genes A study of the diffusion equation with increase in the amount of substance, and its application to a biological problem Diffusion-reaction compartmental models formulated in a continuum mechanics framework: application to COVID-19, mathematical analysis, and numerical study Simulation of spatial spread of the COVID-19 pandemic on the basis of the kinetic-advection model A local and time resolution of the COVID-19 propagation -a two-dimensional approach for Germany including diffusion phenomena to describe the spatial spread of the COVID-19 pandemic Predicting the spatially varying infection risk in indoor spaces using an efficient airborne transmission model Mean field games and nonlinear Markov processes Стохастические процессы в физике и химии Numerically statistical investigation of the partly super-exponential growth rate in the COVID-19 pandemic (throughout the world) Numerical-statistical and analytical study of asymptotics for the average multiplication particle flow in a random medium Further notes on the basic reproduction number Dynamic models of segregation Revisiting the edge of chaos: Evolving cellular automata to perform computations A model based on cellular automata to estimate the social isolation impact on COVID-19 spreading in Brazil Modeling the Spread of Epidemics Based on Cellular Automata Agent-Based Simulation Tools in Computational Epidemiology Modeling the development of the coronavirus epidemic using differential and statistical models Transmission of acute respiratory infections in a city: agent-based approach Covasim: An agent-based model of COVID-19 dynamics and interventions Modelling the impact of testing, contact tracing and household quarantine on second waves of COVID-19 Characterizing superspreading events and age-specific infectiousness of SARS-CoV-2 transmission in Georgia Effectiveness of isolation, testing, contact tracing, and physical distancing on reducing transmission of SARS-CoV-2 in different settings: a mathematical modelling study A stochastic agent-based model of the SARS-CoV-2 epidemic in France COVID-19 superspreading suggests mitigation by social network modulation Feasibility of controlling COVID-19 outbreaks by isolation of cases and contacts The incubation period of coronavirus disease 2019 (COVID-19) from publicly reported confirmed cases: estimation and application Virological assessment of hospitalized patients with COVID-2019 Estimates of the severity of coronavirus disease 2019: a model-based analysis. The Lancet Infectious Diseases Clinical characteristics of 138 hospitalized patients with 2019 novel coronavirus-infected pneumonia in Wuhan, China The logic of animal conflict Anonymous sequential games Mean field games Игры среднего поля, связанные с процессами устойчивого типа A maximum principle for SDEs of meanfield type Mean-field backward stochastic differential equations: a limit approach Global optimal vaccination in the SIR model: Properties of the value function and application to cost-effectiveness analysis Controlling propagation of epidemics via mean-field control COVID-19: Data-Driven Mean-Field-Type Game Perspective Mean field control problems for vaccine distribution Об уравнениях Фоккера-Планка, которые выводятся в теории возмущений методом, основанным на спектральных свойствах возмущённого гамильтониана. Записки кафедры математической физики Института нелинейной механики АН УССР Dynamic Programming Techniques of spatially explicit individual-based models: Construction, simulation, and mean-field analysis On the basic reproduction number and the topological properties of the contact network: An epidemiological study in mainly locally connected cellular automata On the connection between symmetric N-player games and mean field games Ph. Yam. Mean Field Games and Mean Field Type Control Theory Continuous time finite state meanfield games Mean field games and nonlinear Markov processes. ArXiv, 1112.3744v2 Sensitivity analysis for HJB equations with an application to a coupled backward-forward system Probabilistic analysis of meanfield games Mean field games: numerical methods Finite difference methods for mean field games A finite-difference solution of mean field problem with the fractional derivative for subdiffusion Iterative regularization methods for nonlinear ill-posed problems Definitions and examples of inverse and ill-posed problems Гончарский и др Леонов и др On identifiability of nonlinear ODE models and applications in viral dynamics On HIV dynamics: modeling, data analysis, and optimal treatment protocols Bayesian history matching of complex infectiousdisease models using emulation: a tutorial and a case study on HIV in Uganda Sensitivity analysis and practical identifiability of some mathematical models in biology Об устойчивости обратных задач К вопросу об улучшении точности решения системы линейных уравнений Антонов и др Singular value decomposition in an inverse source problem О решении некорректно поставленных задач. Докл Лаврентьев. О некоторых некорректных задачах математической физики. Новосибирск: Наука О некорректно поставленных задачах Identification of biological models described by systems of nonlinear differential equations Global and local optimization in identification of parabolic systems Методы поиска глобального экстремума Новые теоремы о распределении собственных и сингулярных чисел многоуровневых теплицевых матриц Tensor-train decomposition TTDock: метод докинга на основе тензорных поездов Tensor based approach to the numerical treatment of the parameter estimation problems in mathematical immunology Agent-based mathematical model of COVID-19 spread in Novosibirsk region: identifiability, optimization and forecasting Sensitivity and identifiability analysis of COVID-19 pandemic models The SIRC modeland influenza A Mean field game for modeling of COVID-19 spread ), были использованы следующие показатели для Новосибирской области: 1. Официальные статистические данные о выявленных случаях заражения COVID-19, проведенных ПЦР тестов, критических пациентах (подключение аппарата ИВЛ) и умерших были получены более чем из 1000 различных открытых источников с помощью разработанной нами программы автоматического сбора данных 1: Статистические данные COVID-19 по Новосибирской области с 12 Синяя линия -отношение ежедневных тестов ПЦР к выявленным случаям, оранжевая линия -выявленные случаи COVID-19, зеленая линия -умершие от COVID-19, красная линия -критические случаи Информация о распределении населения по возрастным группам доступна на сайте Федеральной службы государственной статистики Сведения о среднем размере семьи: 2,5 человека согласно отчету Росстата были использованы следующие данные по Новосибирской области: 1. Данные по новым выявленным случаям заражения COVID-19, госпитализированным, критическим (требующих подключение аппарата ИВЛ) и умершим. Информация была агрегирована с открытых источников сети Интернет с помощью раз-Возрастная группа 1: Распределение численности населения Новосибирской области по возрастным группам на 1 января 2020 года работанной программы для автоматического сбора данных и доступна для скачивания по ссылке Данные по проценту бессимптомных выявленных случаев от общего числа выявленных случаев заражения COVID-19, а также его прогноз на период моделирования. Данные получены из ежедневных сводок оперативного штаба Москвы, публикуемые в их официальном Телеграм-канале и доступные по ссылке Индекс самоизоляции от Яндекса, а также его прогноз на период моделирования. Индекс публикуется компанией Яндекс и доступен по ссылке Данные по проценту индивидуумов с антителами к COVID-19 от медицинского центра «Инвитро», а также его прогноз на период моделирования. Ежедневная динамика процента индивидуумов с антителами к COVID-19 по лабораторным данным медицинского центра «Инвитро» в Новосибирске доступна по следующей ссылке предоставленным директором Центра по взаимодействию с органами власти и индустриальными партнерами Новосибирского государственного университета, к.ф.-м.н. А.Н. Люлько (см. Рис. A.2, A.3 и A.4). На Рис. A.2 изображены статистические данные с сайта стопкоронавирус.рф по количеству госпитализированных (красная линия) и критических (синяя линия) случаев COVID-19 и данные по захоронениям в городе Новосибирске по причине COVID-19 (черная линия), сглаженные 14-дневной экспоненциальной скользящей средней. Наблюдается хорошая корреляция данных Сравнение графиков данных по захоронениям в городе Новосибирске по причине COVID-19 и новым выявленных случаям заражения COVID-19 (красная линия на Рис. A.4) приведено на Рис. A.4. Наблюдается частичная корреляция данных в смысле градиентного роста/падения. Однако в периоды 20 2: Количество госпитализированных (красная линия) и критических (синяя линия) случаев COVID-19 по Новосибирской области с 24.04.2020 по 06.12.2021 и количество захоронений в городе Новосибирске 3: Количество умерших в результате COVID-19 по Новосибирской области (данные Оперштаба стопкоронавирус.рф, красная линия) и захоронений в городе Новосибирске (черная линия) в результате COVID-19 с 24 Данный эффект возможен из-за небольшого снижения числа проведенных ПЦР-тестов в указанные периоды (см. Рис. A.1, синяя линия) 1.1.529 ЮАР, Ботсвана 09 3: Наиболее значимые штаммы вируса SARS-CoV-2 по версии ВОЗ на 31.12 Данная библиотека написана на языке Python и создана для исследования агентных моделей COVID-19 с нетривиальными структурами. Covasim использовался для анализа эпидемиологической ситуации в более чем десяти странах, а также являлся одним из инструментов для принятия решений о введении ограничительных мер в США, Великобритании и Австралии. Для решения обратных задач для агентно-ориентированной модели (раздел 6.2, был подготовлен программный код на языке Python для интеграции разработанного поэтапного метода восстановления неизвестных параметров с библиотекой Covasim Inverse and Ill-Posed Problems Обратные и некорректные задачи. Сибирское научное издательство, Новосибирск Direct methods of solving inverse hyperbolic problems Identification Problems for Wave Phenomena Inverse Problems for Maxwell's Equations Проекционно-разностные методы определения коэффициентов гиперболических уравнений, Новосибирск, Наука, Сибирское отделение Sensitivity and identifiability analysis of COVID-19 pandemic models // Vavilov Journal of Genetics and Breeding. 2021. V. 25(1) Geoinformation system of tuberculosis spread based on inversion and prediction // Journal of Inverse and Ill-Posed Problems 2020 V. 29(1) Mathematical modeling and forecasting of COVID-19 in Moscow and Novosibirsk region // Numerical Analysis and Applications Sensitivity Analysis and Practical Identifiability of Some Mathematical Models in Biology Global and local optimization in identification of parabolic systems // Journal of Inverse and Ill-Posed Problems 2020 V. 28(6) Differential evolution algorithm of solving an inverse problem for the spatial Solow mathematical model // Journal of Inverse and Ill-Posed Problems 2020 V. 28(5) Mathematical modeling of the Wuhan COVID-2019 epidemic and inverse problems // Computational Mathematics and Mathematical Physics Optimization methods for solving inverse immunology and epidemiology problems // Computational Mathematics and Mathematical Physics A numerical algorithm for constructing an individual mathematical model of HIV dynamics at cellular level // Journal of Inverse and Ill-Posed Problems An algorithm for source reconstruction in nonlinear shallow-water equations // Computational Mathematics and Mathematical Physics A combined numerical algorithm for reconstructing the mathematical model for tuberculosis transmission with control programs // Journal of Inverse and Ill-Posed Problems A numerical algorithm for computing tsunami wave amplitudes // Numerical Analysis and Applications Identification of biological models described by systems of nonlinear differential equations // Journal of Inverse and Ill-Posed Problems A variational approach to reconstruction of an initial tsunami source perturbation // Applied Numerical Mathematics Об авторах КРИВОРОТЬКО ОЛЬГА ИГОРЕВНА, к.ф.-м.н. (2015) , старший научный сотрудник лаборатории обратных задач естествознания Института вычислительной математики и математической геофизики СО РАН, доцент кафедры математических методов геофизики механикоматематического факультета НГУ и кафедры высшей математики физического факультета НГУ. Основные научные интересы -численные методы решения обратных задач эпидемиологии, иммунологии, биологии, цифровой экономики, медицины, социальных процессов, идентифицируемость, оптимизация, анализ и обработка данных методами машинного обучения. Руководитель 7 научных проектов Российского научного фонда, Российского фонда фундаментальных исследований, Президентских грантов для молодых ученых с 2016 года. Лауреат премии мэрии города Новосибирска в сфере науки и инноваций в номинации "Лучший молодой исследователь в организациях науки" за разработку карты прогноза распространения социально-значимых заболеваний в городе Новосибирске (2020) и премии имени Г.И. Марчука за работу "Идентифицируемость математических моделей иммунологии и эпидемиологии" (2021).КАБАНИХИН СЕРГЕЙ ИГОРЕВИЧ, профессор (1993), член-корреспондент РАН (2011), главный научный сотрудник лаборатории обратных задач естествознания ИВМиМГ СО РАН, главный научный сотрудник ИМ СО РАН, заведующий кафедрой математических методов геофизики ММФ НГУ, заведующий лабораторией методов создания, исследования и идентификации математических моделей естествознания НГУ. Основные научные интересы -теория и численные методы решения обратных задач естествознания. Член бюро Отделения математических наук РАН, член Президиума Сибирского отделения РАН, член бюро объединенного Ученого совета СО РАН по математике и информатике. Главный редактор журналов Journal of Inverse and Ill-Posed Problems (WoS Q1) и Сибирский журнал вычислительной математики (WoS).Основные научные публикации (книги):