Vendredi 23 Octobre 2020

Prédictions sur les coronavirus : un volontaire pour aider l'IA à prévoir la propagation de Covid-19


Roni Rosenfeld fait des prédictions pour gagner sa vie. En règle générale, il utilise l'intelligence artificielle pour prévoir la propagation de la grippe saisonnière. Mais avec l'épidémie de coronavirus qui fait des victimes dans le monde entier, il est passé à prédire la propagation de Covid-19.
Ce sont les Centers for Disease Control and Prevention (CDC) qui ont demandé à Rosenfeld de se charger de cette tâche. En tant que professeur d'informatique à l'Université Carnegie Mellon, il dirige le département d'apprentissage automatique et le groupe de recherche Delphi, qui vise à «rendre les prévisions épidémiologiques aussi universellement acceptées et utiles que les prévisions météorologiques le sont aujourd'hui». Le groupe a remporté à plusieurs reprises le défi annuel «Prévoir la grippe» du CDC, où les équipes de recherche s'affrontent pour voir quelles méthodes génèrent les prévisions les plus précises.
Au début, Rosenfeld a reculé lorsque le CDC lui a demandé de prédire la propagation de Covid-19. Il ne pensait pas que ses méthodes d'IA étaient à la hauteur. Pourtant, il essaie de son mieux maintenant - et vous pouvez aider, même si vous ne savez rien de l'IA.
Lorsque j’ai appelé Rosenfeld le 18 mars, il a expliqué que l’une des méthodes de prévision qu’il utilise était la «sagesse des foules». Ces foules sont composées de gens ordinaires, qui n'ont besoin que d'un peu de bon sens, d'une connexion Internet et de quelques minutes par semaine.
Je lui ai expliqué comment il avait prédit la propagation de la grippe saisonnière dans le passé, comment il adaptait ses méthodes pour prédire la propagation du coronavirus et comment nous pouvions aider. Une transcription de notre conversation, éditée pour la longueur et la clarté, suit.
Sigal Samuel
Quand le CDC vous a-t-il demandé de faire des prévisions de coronavirus, et comment vous en êtes-vous senti au départ?
Roni Rosenfeld
C'était il y a trois ou quatre semaines. J'étais très, très réticent.
Il y a beaucoup de gens qui font des prévisions et de nombreuses façons de le faire. Notre approche est très motivée par l'apprentissage automatique, ce qui signifie essentiellement que nous essayons d'apprendre plus du passé que de ce que nous pensons que le mécanisme [of transmission] est. Avec des approches mécanistes, les gens essaient de construire des modèles basés sur une compréhension de la propagation des épidémies. Notre approche n'est pas mécaniste - elle fait très peu d'hypothèses sur la propagation des épidémies et se concentre davantage sur des exemples passés.
Cela a très bien fonctionné pour la grippe saisonnière, car nous avons 20 ans de données provenant de nombreux endroits. Le problème avec la prévision de la pandémie de coronavirus est qu'il n'y a pas de données historiques pour continuer. Les approches basées sur l'apprentissage automatique sont donc les pires ici - elles essaient d'apprendre quelque chose de presque rien. C’est pourquoi j’étais extrêmement réticent à m'engager dans cette voie et j'étais sur le point de refuser le CDC.
Sigal Samuel
Qu'est-ce qui vous a poussé à dire oui, finalement?
Roni Rosenfeld
Eh bien, en plus de l'apprentissage automatique, nous avons une autre méthodologie de prévision, appelée la «sagesse des foules». C'est à ce moment que vous rassemblez au moins plusieurs dizaines de personnes et que vous leur demandez individuellement de faire une évaluation subjective de ce à quoi ressemblera le reste de la saison de la grippe. Ce que nous avons appris par expérience, c'est que chacun d'eux n'est pas très précis, mais son agrégat a tendance à être assez précis.
Mon sentiment était que la sagesse de la méthode des foules pouvait être meilleure que la méthode d'apprentissage automatique. Ils puisent dans différentes ressources. L'apprentissage automatique exploite des exemples passés, et il n'y en a pas beaucoup pour le coronavirus. Mais la sagesse des foules puise dans le raisonnement collectif et le bon sens de beaucoup de gens, et les gens sont en fait assez bons pour trouver des hypothèses raisonnables sur des circonstances inhabituelles.
Je ne suis pas très optimiste quant à l’un ou l’autre d’entre eux de faire des prédictions à long terme - comme dans un mois ou deux - car ce qui se passera dépend beaucoup de ce que nous faisons, des mesures gouvernementales aux décisions des individus concernant la distanciation sociale.
Mais je suis devenu convaincu qu'il y a deux choses que nous pouvons bien faire. L'une consiste à faire des prévisions à très court terme - une à deux semaines à l'avance. La deuxième chose, qui je pense est encore plus importante, ne prévoit pas l'avenir mais le présent - je veux dire essayer d'estimer en temps réel la prévalence actuelle de la maladie. C'est ce qu'on appelle la "prévision immédiate". Sans connaître la prévalence actuelle, vous ne pouvez même pas commencer à comprendre où elle va ensuite.
Sigal Samuel
Cela semble potentiellement très utile, car le nombre de cas confirmés signalés par les autorités de santé publique ne reflète pas toutes les personnes qui ont le virus mais qui n’ont pas encore été testés ou n’ont remarqué aucun symptôme. Comment procédez-vous pour la prévision immédiate?
Roni Rosenfeld
Il existe une variété de sources de données qui peuvent être utilisées pour résoudre le problème: les médias sociaux mentionnent la maladie, la fréquence des requêtes Google avec des termes connexes, la fréquence d'accès aux pages Wikipedia et CDC pertinentes, les achats au détail pour des choses comme médicaments contre la fièvre et thermomètres, et dossiers de santé électroniques.
Nous avons mis à profit tous ces types de données lors de la diffusion de la grippe saisonnière [using machine learning]. Mais nous avons construit des modèles qui étaient adaptés aux données historiques, à savoir sur la relation entre ces sources de données et la prévalence réelle de la grippe.
Le défi avec Covid-19 est que ces relations ne peuvent plus être supposées tenir parce que le comportement des personnes et des systèmes a radicalement changé. Il y a une anxiété accrue, donc les gens peuvent rechercher des informations sur la maladie, pas nécessairement parce qu'ils ont les symptômes mais parce qu'ils sont inquiets et curieux.
Sigal Samuel
Oui, la semaine dernière, j'ai acheté du Tylenol et un thermomètre, non pas parce que j'avais de la fièvre ou d'autres symptômes, mais parce que cela semblait être une bonne idée d'avoir ces choses sous la main au cas où. Il semble qu'il y aura beaucoup de bruit brouillant votre signal.
  
    
    
      
        
    
  
  
    
      
        Il s'agit des prévisions personnelles de Roni Rosenfeld pour la région, notamment le Delaware, le Maryland, la Pennsylvanie, la Virginie et la Virginie-Occidentale. La ligne noire indique quand il pense que l'épidémie de coronavirus y culminera, entre avril et mai. Notez que ce n'est qu'une estimation d'une personne basée sur une hypothèse de distanciation sociale modérée. Le pic rose à gauche correspond à la pandémie H1N1 en 2009, avec l'aimable autorisation de Roni Rosenfeld
      
    
  
Roni Rosenfeld
C'est même pire que le bruit. Nous savons comment gérer le bruit - nous combinons de nombreuses sources pour nous en débarrasser. Le problème ici est le biais systématique, ce qui signifie que le comportement des gens change systématiquement.
Pour vous donner un exemple, de nombreux cabinets de médecins modifient leurs pratiques et demandent aux gens de ne pas venir s’ils soupçonnent qu’ils ont un coronavirus. Cela signifie qu’elles ne seront pas prises en compte dans les mesures que le système de surveillance du CDC enregistre habituellement.
C'est pourquoi bon nombre de ces sources de données ne peuvent plus être fiables ou doivent au moins être recyclées. C’est ce sur quoi nous travaillons actuellement.
Sigal Samuel
Comment allez-vous procéder aux ajustements nécessaires?
Roni Rosenfeld
Pour commencer, nous avons désactivé toutes les sources de données liées à l'anxiété sociale - Twitter, recherches Google, accès à la page Wikipedia. Nous en sommes à la prévision de séries chronologiques à court terme et à la sagesse des foules se concentrant uniquement sur la première semaine. Nous trouvons que ceux-ci sont assez adaptatifs.
Sigal Samuel
Je suis curieux de savoir la méthodologie de la sagesse des foules. Les volontaires que vous obtenez ne sont pas des experts en IA, en prévision ou en épidémiologie. Ce ne sont que des gens ordinaires. Alors de quoi sortent-ils lorsqu'ils font leurs prédictions?
Roni Rosenfeld
Avec la grippe, nous demandons aux gens de prévoir pour différentes régions du pays. Nous leur donnons une carte avec des lignes montrant la montée de la grippe au cours des saisons précédentes, et ils sont censés cliquer et tracer une ligne montrant comment ils pensent que la saison en cours se déroulera - compte tenu de ce qu'ils voient au sujet des saisons précédentes et d'une variété de liens que nous leur donnons à des informations sur la grippe.
Il est peu probable que vous réussissiez très bien, car vous devinez et vous n'êtes pas un expert. Mais vous allez mettre à profit votre raisonnement de bon sens, ce que vous savez des sources d'actualités actuelles et ce que vous savez de vos amis et de votre famille sur ce qui se passe dans votre région. Et lorsque nous regroupons des dizaines de ces suppositions, la prédiction est en fait assez bonne, du moins pour la grippe.
Une fois que vous êtes satisfait de votre supposition, vous cliquez sur enregistrer et nous vous remercions beaucoup. Nous avons même un classement pour suivre l'exactitude des prévisions de différentes personnes. Vous pouvez voir à quel point les gens se sont débrouillés la semaine dernière et à quel point ils s'en sortent cumulativement.
Sigal Samuel
Les gens sont-ils vraiment compétitifs à ce sujet et sont-ils fiers de leur score?
Roni Rosenfeld
Absolument ! Ma femme est très compétitive et elle est très frustrée chaque fois que je la batte. Elle dit: "Je vais te battre cette fois ! " Et elle me bat à l'occasion, même si elle n'est pas experte.
Nous avons constaté qu'être un expert n'est pas nécessairement utile. Ce qui est utile, c'est de prêter attention aux détails et d'être très consciencieux à ce sujet. Certaines personnes prennent une minute pour faire chacune des régions, et elles pourraient bien le faire. Mais les personnes qui réussissent le mieux sont celles qui prennent leur temps et font des ajustements précis. Nous vous demandons de ne pas le faire une seule fois, mais de le mettre à jour chaque semaine. Si vous êtes paresseux et dites: «Ce que j'ai fait la semaine dernière était assez bon», vous ne ferez pas aussi bien.
Sigal Samuel
Des sons comme celui-ci récompensent vraiment les perfectionnistes et les obsédés soucieux du détail parmi nous, que je peux, pour ma part, soutenir. Où les lecteurs peuvent-ils aller s'ils souhaitent faire du bénévolat? Et y a-t-il autre chose qu'ils devraient savoir?
Roni Rosenfeld
Ils peuvent accéder à notre plateforme Crowdcast. Je pense que cela vaut la peine, car cela nous donnera des indications. Mais je peux vous dire à l'avance quel est le problème. Ce n’est pas difficile d’obtenir des volontaires pour le faire la première fois. Et certains d'entre eux pourraient le faire la deuxième semaine. Mais à mesure que la nouveauté disparaît, ils ont tendance à perdre leur motivation dès la troisième semaine.
Si nous pouvions amener des centaines de personnes à le faire de manière cohérente, nous pourrions faire bien plus que ce que nous faisons actuellement. Le CDC voudrait que nous couvrions chaque état, mais nous avons besoin de plusieurs dizaines de personnes pour faire chaque état. Faire évoluer cela est vraiment important, mais avec des gens qui sont à long terme. L'important est de le faire de manière cohérente, et vous vous améliorez plus vous le faites.
Sigal Samuel
Je trouve cela vraiment attrayant parce que nous nous sentons tous si impuissants en ce moment. Il est psychologiquement utile de sentir qu’il y a quelque chose d’utile que nous pouvons faire de chez nous.
En ce moment, je suis assis dans ma chambre à Washington, DC. À ce stade, vous sentez-vous en mesure de prédire quand l'épidémie de coronavirus atteindra un pic dans ma région? Quelles sont vos propres prévisions personnelles et sur quoi vous basez-vous?
Roni Rosenfeld
Je m'attends à ce qu’en avril ou mai, nous assistions à un pic - à moins que nous ne réprimions vraiment, comme d’autres endroits l’ont fait en s’abritant sur place. Ceci est basé sur la contagiosité de ce virus et sur une hypothèse de distanciation sociale modérée.
En réalité, je pense que notre pays ne permettra pas que cela se produise, car une vague épidémique de cette ampleur submergera gravement le système de santé et augmentera considérablement le nombre de morts. Il est donc très probable que nous mettrons en œuvre des mesures d'atténuation plus sévères et essaierons de limiter la vague. Inscrivez-vous à la newsletter Future Perfect et nous vous enverrons un tour d'horizon des idées et des solutions pour relever les plus grands défis du monde - et comment vous améliorer en faisant le bien.

  
    
      
        
vox-mark

Prédictions sur les coronavirus : un volontaire pour aider l'IA à prévoir la propagation de Covid-19

Inscrivez-vous au
        
          bulletin
        
      
      Future Perfect

Recevez notre newsletter dans votre boîte de réception deux fois par semaine.
    
    

    
  

Future Perfect est financé en partie par des contributions individuelles, des subventions et des parrainages. Apprendre encore plus ici.