Liens transverses ENS de Lyon

Actualité de l'ENS de Lyon

Comment estimer l’évolution du Covid-19 malgré des données de contaminations de qualité limitée

logo The Conversation
Actualité / Publication

Résumé

Article du 6 avril 2022, paru dans le média en ligne The Conversation, dans le cadre du partenariat avec l'ENS de Lyon.
Par Patrice Abry, Directeur de Recherche CNRS et directeur de l’Institut Rhônalpin des Systèmes Complexes (IXXI).

Description

La pandémie de Covid-19 a durement éprouvé l’ensemble de nos sociétés, mettant en évidence de nombreuses faiblesses et produisant des défis multiples et de natures très variées. Les mondes de la recherche et de l’université n’ont pas été épargnés par cette crise. Au-delà de la difficulté de faire fonctionner les structures d’enseignement, deux questionnements fondamentaux se sont imposés, relatifs à la pratique de la recherche interdisciplinaire, d’une part, et aux relations entre la science et la société d’autre part. Ainsi, nombres de chercheurs, bien au-delà des disciplines « naturellement » convoquées (épidémiologies, virologie…) se sont interrogés sur la façon de contribuer aux efforts entrepris par l’ensemble de la société pour lutter contre le fléau pandémique.

Dans ce contexte, notre équipe de chercheurs (physiciens, spécialistes de la théorie de l’information, informaticiens, cartographes, sociologues, philosophes…), rompus à l’exercice de la recherche interdisciplinaire par nos travaux antérieurs au sein de l’Institut Rhône-Alpin des systèmes complexes, a réfléchi à la construction d’un outil robuste de quantification de l’évolution spatio-temporelle de l’intensité de la pandémie et du rendu de cette estimation à destination du grand public et des citoyens.

Notre équipe n’était pas spécialisée en épidémiologie au moment de la survenue du premier confinement. Cependant, un intense travail de recherche bibliographique a rapidement permis d’imaginer que l’utilisation d’un modèle mis au point par des épidémiologistes durant les précédentes pandémies, combiné à des outils d’analyse du signal et de l’image, que nous avions récemment développés, et qui permettent de détecter les bulles de gaz dans un enregistrement filmé d’écoulement liquide, permettrait de mesurer l’intensité de la pandémie.

La surveillance de l’intensité d’une pandémie repose fondamentalement sur l’observation régulière du nombre de nouvelles infections. Les mesures réalisées pendant la pandémie de Covid-19 présentent cependant la particularité d’être de qualité très limitée, et ce dans tous les pays du monde. Elles sont, en effet, fortement corrompues par des comptes aberrants, parfois négatifs, des valeurs manquantes (les week-ends ou jours fériés), des comptes reportés les jours suivants.

Après deux ans de pandémie, la qualité des données reste limitée, induisant ainsi une des difficultés majeures pour réaliser une estimation fiable et robuste de l’évolution de l’intensité de la pandémie (cf. figure 1, graphique supérieur).

La surveillance de la pandémie

Quoique la surveillance d’une pandémie puisse être envisagée de multiples façons par différentes sciences, l’épidémiologie recourt le plus souvent aux modèles à compartiments. La population est répartie en « compartiments » (sains, malades, guéris, décédés…) dont les tailles évoluent au cours du temps selon un ensemble de lois « simples ».

Cependant, pour rendre compte d’une pandémie qui affecte toute la population mais par des canaux divers et avec des intensités différentes, il faut beaucoup de compartiments, ce qui complique significativement l’utilisation pratique et réelle de tels modèles pendant la pandémie et en présence de données de qualité réduite.

La surveillance dans un contexte intrapandémie est donc souvent réalisée à l’aide d’un modèle plus sommaire, on abandonne la découpe en compartiments, mais plus robuste, on se concentre sur un seul paramètre : l e taux de reproduction de la pandémie R, qui mesure le nombre d’individus qui seront, en moyenne, infectés par une seule et même personne déjà infectée.

Le modèle épidémiologique développé dans cette étude et utilisé préserve le mécanisme fondamental de propagation d’une épidémie : le nombre de nouvelles infections aujourd’hui dépend du taux de reproduction, que l’on cherche à mesurer, multiplié par une moyenne des nombres d’infections de jours précédents, moyenne pondérée par la fonction sérielle d’intervalle. Pour les pandémies à coronavirus, cette fonction sérielle est connue, de valeur moyenne 7 jours et prenant des valeurs significatives de 3 à 12 jours. L’originalité de ce modèle est de rendre R dépendant du temps, R_t, et d’ainsi pouvoir suivre ses variations : plus R_t s’éloigne de 1 par valeurs supérieures plus la pandémie accélère, plus il se rapproche de 0 plus la pandémie ralentit.

C’est à l’estimation (c’est-à-dire l’évaluation de sa valeur à partir des données observées) de l’évolution en temps et en espace de ce R_t que nous nous sommes intéressés.

À partir de ce modèle, il est aisé d’obtenir une expression théorique de l’estimation de R_t aujourd’hui. Cette estimation, mise en œuvre sur les données réelles de Covid-19, produit une mesure de l’intensité de la pandémie. Cette estimée est totalement inutilisable pour les épidémiologistes car fortement variable et très erratique d’un jour au suivant alors que R_t est, par nature, une quantité qui ne peut varier que faiblement et lentement au cours du temps. Cette piètre estimation résulte de deux causes, l’une structurelle, l’autre conjoncturelle : d’une part, on veut estimer R_t chaque jour à partir d’une seule nouvelle donnée, une situation peu robuste statistiquement. D’autre part, la faible qualité, les valeurs aberrantes biaisent l’estimation.

Un modèle de physique appliqué à l’épidémiologie

Ces difficultés d’estimation sont classiquement rencontrées dans d’autres contextes, ceux de la détection de bulles de gaz dans un écoulement liquide, par exemple, auquel nous nous intéressions avant la pandémie. Pour y faire face, il faut envisager des stratégies de régularisation. On adjoint au modèle épidémiologique des contraintes que l’estimée de R_t doit respecter. On lui impose donc ici naturellement d’être positif ou nul, d’être lentement variable en temps.

On impose également que les R_t mesurés sur des territoires « voisins », les départements français partageant une frontière terrestre par exemple, soient peu différents.

Prendre en compte la limitation conjoncturelle (faible qualité des données observées) se fait classiquement par un prétraitement des données. Dans le contexte temps réel et évolutif de la pandémie de Covid-19, la modélisation de ce prétraitement aurait été fastidieuse et délicate : elle aurait dû dépendre de chaque pays, et, pour un même pays, aurait dû varier au fur et à mesure de l’évolution du suivi de l’épidémie.

Nous avons construit une stratégie alternative qui consiste à réaliser en même temps et l’estimation de R_t et le traitement des données aberrantes, sans modélisation préalable de celles-ci. Nous avons alors « perturbé » de façon fine le modèle épidémiologique pour autoriser l’occurrence de valeurs aberrantes, tout en préservant les fondements du mécanisme épidémiologique.

Nos résultats

Nos outils permettent d’obtenir une estimation très réaliste de R_t : elle varie peu et lentement d’un jour à l’autre et est donc plausible vis-à-vis des mécanismes épidémiologiques. De plus, l’estimation des valeurs aberrantes permet une estimation des nombres réels de nouvelles infections.

Figure 1 : Évolution de l’intensité de la pandémie de Covid-19 en France. Graphique supérieur : Nombres de nouvelles infections quotidiennes rapportées (noir) et nombres de nouvelles infections quotidiennes estimées(rouge). Graphique inférieur : Estimations du taux de reproduction de la pandémie R, robuste et réaliste (rouge).

Nos outils sont mis en œuvre automatiquement et quotidiennement pour produire un estimé temps réel de la pandémie pour près de 200 pays ou territoires autonomes.

Avec pour objectif un transfert libre et direct d’information sur l’état de la pandémie vers la société et les citoyens, les graphiques, mis à jour quotidiennement et représentant l’évolution au cours du temps de la pandémie, sont accessibles à cette adresse. Ils sont complétés par des cartes interactives (le pays d’intérêt peut être choisi) et animées (l’évolution en temps peut être activée) permettant de visualiser conjointement les évolutions en temps et en espace de la pandémie dans le monde.

Par ailleurs, l’évolution spatio-temporelle de la pandémie à travers les départements de France métropolitaine, estimée à partir des comptes de nouvelles infections ayant entraînées une hospitalisation, tels que mis en libre accès par Santé Publique- France, est mise à jour quotidiennement et rendue accessible sous forme d’une carte interactive.

Carte de France du taux de reproduction estimé R(T). Source : Patrick Abry, fourni par l'auteur

Ces estimées spatio-temporelles, graphiques et cartes ont un double intérêt. Rétrospectivement, elles permettent de quantifier l’impact de mesures sanitaires (confinement, couvre-feu…) sur l’évolution de la pandémie et de comparer ces impacts sur différents territoires, départements ou pays. Prospectivement, le choix de produire des estimées linéaires par morceaux, a pour conséquence de livrer non seulement une estimée de R aujourd’hui mais aussi de la tendance actuelle, et ainsi de prévoir l’évolution de la pandémie à l’horizon de l’échelle de temps imposée par la fonction sérielle, de quelques semaines seulement donc. L’outil ne permet ainsi pas de prévoir le long terme mais de donner la tendance à court terme, ce que la langue anglaise désigne efficacement par le terme de « nowcasting » (par opposition à « forecasting »).

Au-delà des publications dans des journaux scientifiques internationaux, cette méthodologie a été présentée à plusieurs reprises devant les communautés interdisciplinaires de recherche constituées par les organismes acteurs de la recherche, la structure ModCov du CNRS ou la cellule « Corona » de l’Académie des sciences. Ce travail a également donné naissance au séminaire interdisciplinaire « La Covid-19 : regards et questions interdisciplinaires » de l’Institut Rhône-alpin des systèmes complexes.The Conversation

Patrice Abry, Directeur de Recherche au CNRS, ENS de Lyon

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

The Conversation France est un média en ligne d'information et d'analyse de l'actualité indépendant, qui propose des articles grand public écrits par des enseignants, des chercheurs et des doctorants, en étroite collaboration avec une équipe de journalistes expérimentés. L'objectif ? Éclairer l'actualité par de l'expertise fiable fondée sur des recherches.
L'ENS de Lyon a adhéré à The Conversation afin d'offrir à ses membres la possibilité de publier dans ce média. Chercheur, enseignant-chercheur, doctorant de l'ENS de Lyon ou affilié à l'un de ses laboratoires ? Pour plus d'information sur ce partenariat : The Conversation - mode d'emploi (accès réservé - intranet).

Collection
Disciplines
Mots clés