9 - Processus de modélisation

La modélisation épidémiologique et son usage pour gérer la COVID-19

Éclairage sur les modèles mécanistes par l'équipe DYNAMO

Au cours des prochaines semaines, nous présenterons quelques éléments clés de la modélisation en épidémiologie au travers d'articles courts à vocation pédagogique. Ces articles vous aideront à mieux comprendre et décrypter les hypothèses sur lesquelles reposent les modèles épidémiologiques beaucoup utilisés en ce moment, et comment ces hypothèses peuvent impacter les prédictions de la propagation des pathogènes, notamment du SARS-CoV-2. L’objectif est de découvrir les avantages et les limites de la modélisation mécaniste, approche au centre des travaux de l’équipe DYNAMO. Les exemples de modèles seront inspirés des modèles utilisés en ces temps de crise, mais parfois simplifiés pour les rendre accessibles.

#9 – Le processus de modélisation

Dans les articles précédents, nous avons montré quelques-unes des grandes étapes de la vie d’un modèle, à partir d’exemples concrets. Nous avons vu ainsi le rôle des hypothèses, des connaissances et des données dans l’élaboration du modèle. Au-delà du cas d’une maladie particulière, la modélisation s’inscrit en fait dans une démarche scientifique plus vaste d’élaboration des connaissances que nous allons expliquer plus en détail ici.

La modélisation comparée aux autres méthodes d’acquisition de connaissances

Pour mieux comprendre un système biologique, trois approches complémentaires sont utilisées : l’observation, l’expérimentation, la modélisation.

  • L’observation étudie le système réel et apporte des connaissances et des données dans un contexte précis (une période, une zone). Cependant, des biais d’observation existent : les tests de dépistage sont imparfaits, un échantillonnage fiable d’un point de vue statistique n’est pas toujours faisable et les conditions d’observation (observateur, météo, conservation des échantillons, saisie des données) peuvent être variables. De plus, il est impossible d’observer de manière exhaustive le système (des processus sont dits non observables) et de connaître l’impact des variations inhérentes à tout système biologique sur les observations. L’extrapolation à une autre période ou zone est donc complexe sans des suivis longitudinaux à long terme et à grande échelle, que le coût en temps et moyens rendent rares et difficiles à maintenir, surtout dans le contexte actuel de la recherche.
  • L’expérimentation apporte des informations très précises sur un processus particulier, en conditions contrôlées. Elle permet l’observation de processus pour lesquels on ne dispose pas de protocole de collecte en routine (ex : suivi de la réponse immunitaire intra-hôte) au prix d’une simplification du système expérimental (espèces modèles, conditions de vie, etc.). De plus, la quantité de données collectées est généralement faible du fait des coûts très importants de ces expérimentations.
  • La modélisation étudie le système dans son ensemble, de manière intégrative. Cette approche demande moins de temps et de ressources tout en permettant de comparer un très large éventail de situations, toutes choses égales par ailleurs. On peut même évaluer des mesures qui n’existent pas encore, et il n’y a pas de limite éthique puisque le système est virtuel. Cependant, c’est une représentation simplifiée de la réalité, reposant sur des hypothèses, et nourrie de connaissances et de données (d’observation ou expérimentales). Cette approche doit se nourrir des interactions entre disciplines, et avec les utilisateurs finaux des résultats des modèles.

Des allers-retours continus entre modèle et connaissances / données d’observation ou expérimentales

Le processus de modélisation

Développer un modèle est un processus largement itératif, qui doit intégrer de nouvelles connaissances, de nouvelles données d’observations, mais aussi l’inflexion des questions d’intérêt auxquelles le modèle cherche à répondre. Au moins 3 phases se suivent classiquement :

  • 1ère étape (bleu) - Un modèle ne peut pas répondre à tout, il faut spécifier son usage et vérifier que l’approche de modélisation est pertinente pour répondre à la question posée. Comme dans les études observationnelles, il faut délimiter le système à étudier : quelles sont les hypothèses quant aux mécanismes impliqués ? Quelles connaissances (souvent hétérogènes et diffuses) sont disponibles ? A partir de là, on peut construire le schéma conceptuel du modèle, qui liste ses variables d’état, les transitions entre états (structure du modèle), les fonctions et paramètres requis, mais aussi les hypothèses sous-jacentes et ce que le modèle pourra prédire (cf. article #1). Cette étape collective associe toutes les disciplines requises selon la question. Pour la Covid-19 par exemple, regrouper des épidémiologistes, des virologistes, des infectiologues, des immunologistes, permettra d’identifier les processus clés dans la dynamique d’infection de l’humain, les données et connaissances disponibles, ainsi que les principales lacunes de connaissances. Maîtriser la propagation est une question plus complexe que seulement comprendre sa transmission, avec des implications au-delà de la biologie, qui impliquera plus de disciplines. Aboutir à ce schéma est une étape collective importante qui ne doit pas être négligée !
  • 2ème étape (turquoise) - Ce schéma est ensuite implémenté, soit sous la forme d’un système d’équations s’il est suffisamment simple (modèle mathématique), soit en code informatique (modèle de simulation). Les sorties du modèle sont évaluées, en les confrontant à des avis d’experts, ou en les comparants à des observations si des données sont disponibles. Le modèle peut être ajusté lors de cette étape, en estimant les paramètres les plus incertains (cf. article #8), ou en révisant certaines de ses hypothèses.
  • 3ème étape (orange) - Le modèle est alors utilisable, différemment selon ses capacités prédictives. La sensibilité du modèle à la variation de ses paramètres est analysée pour identifier les lacunes de connaissances les plus préjudiciables, et les potentiels leviers de maîtrise du système. Si les prédictions du modèle sont robustes aux incertitudes et que le modèle est considéré comme pertinent (suite aux analyses ci-avant et suite aussi à des discussions avec ses utilisateurs finaux, souvent les gestionnaires du système modélisé), il est utilisé via des expériences numériques pour comparer des scénarios, identifier des situations optimales, comprendre l’impact d’un changement de pratiques, etc. Les nouvelles questions amenées par cette étape peuvent nécessiter de poursuivre le processus de modélisation en reprenant depuis l'étape 1. De même, si de nouvelles connaissances ou données sont générées.

Construire un modèle : un monde de compromis

La conception d’un modèle ne peut aucunement résulter de choix unilatéraux :

  • Le modèle est co-construit avec les biologistes et les utilisateurs finaux : il faut donc s’assurer que le modèle soit transparent, sans hypothèse cachée dans le code, pour faciliter les interactions entre disciplines, et qu’il soit lisible par les utilisateurs finaux pendant le processus de co-construction.
  • Il faut s’assurer de la pertinence des prédictions, de leur domaine de validité, de leur robustesse par rapport aux incertitudes sur les paramètres et la structure du modèle, et ce de la part des diverses disciplines mobilisées.
  • Plus le modèle est compliqué, moins il est facile d’en renseigner les paramètres … mais souvent plus il est réaliste et donc lisible par les biologistes et les utilisateurs finaux. La parcimonie est de mise, tout en maintenant un bon niveau de flexibilité et de modularité pour ne pas avoir à reprogrammer le modèle à chaque révision de ses hypothèses. Cela facilite aussi sa mise à jour lorsque de nouvelles connaissances sont produites. Par contre, cela diminue souvent la performance des codes, bien que des solutions techniques existent aujourd’hui pour y remédier.

Dans l'article #10, nous verrons comment analyser un modèle de simulation.