3 - Qualité de cette prédiction

La modélisation épidémiologique et son usage pour gérer la COVID-19

Éclairage sur les modèles mécanistes par l'équipe DYNAMO

Au cours des prochaines semaines, nous présenterons quelques éléments clés de la modélisation en épidémiologie au travers d'articles courts à vocation pédagogique. Ces articles vous aideront à mieux comprendre et décrypter les hypothèses sur lesquelles reposent les modèles épidémiologiques beaucoup utilisés en ce moment, et comment ces hypothèses peuvent impacter les prédictions de la propagation des pathogènes, notamment du SARS-CoV-2. L’objectif est de découvrir les avantages et les limites de la modélisation mécaniste, approche au centre des travaux de l’équipe DYNAMO. Les exemples de modèles seront inspirés des modèles utilisés en ces temps de crise, mais parfois simplifiés pour les rendre accessibles.

#3 – Quid de la qualité prédictive des modèles en début d’épidémie ?

Avant de lire cet article, nous vous conseillons de lire d’abord les article #1 et article #2.

Imaginons maintenant que nous soyons au début d’une épidémie d’une nouvelle maladie, par exemple la COVID-19 ! Voici ce qui était observé en France au début, en février et en mars 2020, en termes de nombre de morts cumulés :

Nombre de décès cumulées par jour selon 4 jeux de paramètres (zoom sur le début de l'épidémie)

Données observées en France de mortalité cumulée due à la COVID-19 entre le 1er janvier et le 6 mars 2020 (croix), et prédictions (lignes) du modèle SAIRM pour 4 jeux de paramètres différents, définis dans le tableau ci-dessous. Les données observées présentent des plateaux (1 décès par jour, puis 2 décès par jour), car ce sont les 1ers décès déclarés en France, la propagation venant juste de démarrer.

Superposons aux données observées les prédictions du modèle SAIRM décrit dans les articles précédents pour quatre jeux de paramètres différents. Visuellement, il est difficile de se prononcer quant au scénario qui sera le plus réaliste ! Aucun n’est parfait, le modèle étant par essence une simplification de la réalité. Cependant, ce « petit » modèle a déjà beaucoup de paramètres, qui ne peuvent être estimés précisément à ce stade car les données disponibles ne sont pas « assez nombreuses » … Et pourtant, au dernier point, on est dix jours avant le début du confinement !

Paramètre

Définition

Set 1

(1-p)

Proportion d’infectés symptomatiques à risque de mourir

1%

50%

20%

20%

βA

Taux de transmission par les A (par individu et par jour)

0.296

0.40

0.15

0.10

βI

Taux de transmission par les I (par individu et par jour)

0.293

0.20

0.30

0.305

1/γA

Durée moyenne dans A (jours)

7.5

5

14.3

25

1/γI

Durée moyenne dans I (jours)

27.5

16.7

33.3

27.8

α

Taux de mortalité des I (par jour)

0.0073

0.00015

0.0073

0.015

date_intro

Date d'introduction du virus

7/01

7/01

10/01

9/01

Valeurs des paramètres pour les 4 scénarios.

On pourrait vouloir utiliser indifféremment ces quatre prédictions, voire même complexifier le modèle pour le rendre plus réaliste, et ainsi ajouter des paramètres dont on ne connaîtrait toujours pas la valeur… Le problème est que les dynamiques prédites à plus long terme deviennent rapidement très différentes :

Nombre de décès cumulés par jour selon 4 jeux de paramètres

Prédictions des 4 scénarios à horizon de temps plus lointain, du 1er janvier au 18 juin, (170 jours plus tard) : mêmes
les scénarios qui semblaient très proches (noir & vert) ont un écart de 20 000 morts après 100 jours supplémentaires !

Chaque jour compte dans cette course à la prédiction, apportant de nouvelles connaissances et de nouvelles observations utiles pour préciser les paramètres, mais aussi de nouveaux cas et de nouveaux décès… Bien sûr, quand on sera à la fin de l’épidémie, il sera beaucoup plus aisé de calibrer correctement les modèles, mêmes les plus complexes, et de prédire la dynamique épidémique sur la base de données devenues historiques !

L'article#4 discutera des hypothèses du modèle quant au démarrage de l’épidémie.