5 - Hétérogénéité des individus (1/2)

La modélisation épidémiologique et son usage pour gérer la COVID-19

Éclairage sur les modèles mécanistes par l'équipe DYNAMO

Au cours des prochaines semaines, nous présenterons quelques éléments clés de la modélisation en épidémiologie au travers d'articles courts à vocation pédagogique. Ces articles vous aideront à mieux comprendre et décrypter les hypothèses sur lesquelles reposent les modèles épidémiologiques beaucoup utilisés en ce moment, et comment ces hypothèses peuvent impacter les prédictions de la propagation des pathogènes, notamment du SARS-CoV-2. L’objectif est de découvrir les avantages et les limites de la modélisation mécaniste, approche au centre des travaux de l’équipe DYNAMO. Les exemples de modèles seront inspirés des modèles utilisés en ces temps de crise, mais parfois simplifiés pour les rendre accessibles.

#5 – Pourquoi représenter l’hétérogénéité des individus infectés dans le modèle ? (1/2)

Nous avons vu qu’il était souvent difficile de déterminer les valeurs des paramètres du modèle. Pourtant, nombres de modèles mobilisés pendant la crise de la COVID19 (ainsi d’ailleurs que pour d’autres systèmes épidémiologiques) représentent assez finement l’hétérogénéité des individus infectés, augmentant alors la complexité du modèle.

Prenons l’exemple suivant : au lieu des deux états A et I considérés dans les articles précédents (article #1), ajoutons maintenant une phase de latence E et une phase d’incubation E+Ip. Les individus E sont infectés, mais ne sont pas encore excréteurs et n’ont pas de symptômes. Quant aux individus Ip, ils commencent à excréter avant l’apparition possible de symptômes. Nous conservons la distinction entre les individus a- ou pauci-symptomatiques (Ia) et les individus symptomatiques (Is), ces derniers étant les seuls à risque de mourir de l’infection.

Schéma de modélisation incluant une phase de latence

Ce modèle épidémiologique considérant 7 états : sensibles (S), infectés latents non excréteurs (E), infectés excréteurs en incubation (sans symptôme, Ip), infectés excréteurs a- ou pauci-symptomatiques (Ia), infectés excréteurs symptomatiques (Is), guéris (R), et morts (M). La force d’infection (λ) tient compte des contributions différentes des individus excréteurs (Ip, Ia, Is) aux nouvelles infections.

Ce modèle a forcément plus de paramètres (9 au lieu de 6 paramètres précédemment) et plus d’états (7 au lieu de 5). Il est donc plus compliqué (on dit aussi qu’il est moins parcimonieux). Souvent, des hypothèses supplémentaires permettent de réduire la complexité pour la rendre plus pertinente au regard des connaissances disponibles. Par exemple, on peut supposer que les individus excréteurs sans symptômes (Ip et Ia) ont les mêmes niveaux d’excrétion (donc βp = βa) en l’absence de plus d’information.

Mais pourquoi complexifier le modèle ? Deux éléments l’expliquent d’un point de vue méthodologique :

  • La contribution des individus infectés aux nouveaux cas peut différer selon l’avancée de l’infection, ce qui est difficile à prendre en compte sans distinguer ces stades. Par exemple, en début d’infection (stade E), les individus ne sont plus sensibles (donc ne peuvent plus s’infecter) mais n’excrètent pas encore (donc ne contribuent pas aux nouveaux cas) ce qui va induire un délai dans le démarrage de l’épidémie.
  • Les modèles à compartiments de type markovien (sans mémoire) font l’hypothèse d’une distribution exponentielle du temps de séjour dans les compartiments, ce qui n’est pas très réaliste (article #1). Pour y remédier, il faudrait en toute rigueur changer le formalisme mathématique sous-jacent (modèles à délai). Une alternative pour réduire l’impact de cette hypothèse est de considérer plusieurs sous-états successifs, car une somme de durées suivant des distributions exponentielles converge assez rapidement vers une durée quasi constante.

Quelle est la conséquence du changement de structure du modèle sur les prédictions ?

Comparons par exemple le modèle décrit dans la figure ci-dessus (courbe en noir ci-dessous), considérant explicitement une phase de latence sans excrétion (E) suivie d’une phase d’excrétion pré-symptomatique (Ip), avec un modèle intégrant E et Ip en une seule phase Ip2 qui représente alors toute la durée d’incubation (courbe en rouge). Actualisons les paramètres relatifs à Ip2 pour que les deux modèles soient comparables. La durée dans Ip2 devient : dp2 = dp1 + dE, avec dp1 = 1/γp et dE = 1/ε. Le taux de transmission intègre que l’excrétion des E est nulle pendant dE : βp2 = (βp1dp1) / (dE + dp1).

Nombre de décès cumulés par jour en considérant (en noir) ou non (en rouge) une phase de latence

Prédiction des modèles incluant explicitement (en noir) la phase de latence (E) ou non (en rouge) : l’épidémie prédite par le modèle rouge démarre plus vite que celle prédite par le modèle noir, alors que les paramètres sont comparables.

On voit nettement l’effet retardateur de la phase de latence sur la dynamique épidémique. Il est donc essentiel de disposer autant que faire se peut de connaissances biologiques précises sur le déroulement de l’infection au sein de l’hôte pour savoir si une telle phase de latence est pertinente ou non et quelle est sa durée.

L’article #6 poursuivra cette discussion, en tenant compte de facteurs de complexification des modèles en lien avec leur réalisme et leur utilisation pour la gestion de la santé.