lundi 31 mars 2014

Big data: are we making a big mistake?

http://www.ft.com/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html#axzz2xH3TZgd9

High quality global journalism requires investment. Please share this article with others using the link below, do not cut & paste the article. See our Ts&Cs and Copyright Policy for more detail. Email ftsales.support@ft.com to buy additional rights. http://www.ft.com/cms/s/2/21a6e7d8-b479-11e3-a09a-00144feabdc0.html#ixzz2xUSkoFl5

Suivez l'évolution de la grippe dans le monde entier



Nous avons remarqué que certains termes de recherche étaient des indicateurs efficaces de la propagation de la grippe. Google Suivi de la grippe rassemble donc des données de recherche Google pour fournir une estimation quasiment en temps réel de cette propagation à l'échelle mondiale.


Chaque semaine, des millions d'internautes du monde entier recherchent des informations ayant trait à la santé. Naturellement, nous enregistrons davantage de recherches sur la grippe durant la saison des grippes, sur les allergies pendant la saison des allergies et sur les coups de soleil au cours de la période estivale. Vous pouvez explorer l'ensemble de ces phénomènes à l'aide de Google Tendances des recherches. Cependant, est-il possible de créer un modèle précis et fiable représentant un phénomène réel à partir de simples tendances constatées dans les requêtes de recherche ?
Nous avons en effet remarqué une corrélation étroite entre le nombre d'internautes qui recherchent des termes liés à la grippe et le nombre de personnes présentant les symptômes de cette maladie. Fort heureusement, les internautes qui recherchent le terme "grippe" ne sont pas tous malades, mais une corrélation se dessine lorsque toutes les requêtes de recherche sont rassemblées. La comparaison du nombre de requêtes Google par rapport aux données des systèmes de surveillance conventionnels a démontré que la fréquence de nombreuses requêtes augmentait au moment de la saison des grippes. Par conséquent, nous pouvons estimer la progression de la grippe dans des pays ou des régions du monde en comptabilisant ces requêtes. Nos résultats ont été publiés dans la revue spécialisée Nature.

Estimations historiques

Voir les données pour : 
États-Unis - Propagation du virus
Estimation de la grippe  Estimation Google Suivi de la grippe  Données pour : États-Unis
États-Unis : Données publiques sur le syndrome grippal (ILI) fournies par les Centres américains de prévention et de contrôle des maladies.
Ces graphiques présentent des estimations de la progression de la grippe basées sur l'historique des requêtes dans plusieurs pays et régions, estimations mises en parallèle avec les données de surveillance officielles concernant la grippe. Comme vous pouvez le voir, les estimations issues des requêtes de recherche Google à propos de la grippe sont très proches des indicateurs conventionnels de propagation du virus. Évidemment, ces données passées ne sauraient garantir nos résultats futurs.
Dans ce cas, pourquoi générer des estimations à partir d'une synthèse des requêtes de recherche ? Le système conventionnel de surveillance de la grippe est primordial, mais la plupart des agences se limitent à un pays ou à une région, et leurs estimations ne sont mises à jour qu'une fois par semaine. Le site Google Suivi de la grippe propose, quant à lui, des données relatives à plusieurs pays du monde qui sont actualisées quotidiennement. Il vient donc compléter les systèmes en place.

En savoir plus sur les recherches associées à Google Suivi de la grippe :

Lire l'article publié par la revue spécialisée Nature, Detecting influenza epidemics using search engine query data (Détection des épidémies de grippe à l'aide des requêtes saisies dans les moteurs de recherche)
HTML | PDF
Télécharger les estimations de Google Suivi de la grippe pour le monde entier
Pour les épidémiologistes, il s'agit d'une avancée importante, car plus une épidémie est détectée rapidement, plus il est possible de réduire le nombre de personnes affectées. Si une nouvelle souche du virus de la grippe apparaissait dans certaines conditions, une pandémie pourrait provoquer des millions de morts (comme cela s'est produit en 1918). Les pouvoirs publics et les professionnels de santé pourraient utiliser nos estimations à jour pour mieux répondre aux épidémies saisonnières et aux pandémies.

Google Suivi de la grippe (version expérimentale)

Pour les pays portant la mention "version expérimentale", nous avons rassemblé les requêtes relatives à la grippe pour établir une courbe saisonnière simulant la propagation réelle du virus. En général, ces estimations n'ont pas été comparées aux données officielles de surveillance de la grippe. Vous pouvez télécharger les estimations expérimentales relatives à un pays depuis la page Google Suivi de la grippe (version expérimentale) correspondante.