Les instituts de sondage ne seront pas ubérisés

Cette fois, c’est à tort qu’on les a fait trembler. Après plusieurs déconvenues successives (Brexit, Trump, Fillon à la Primaire des Républicains), les instituts traditionnels de sondage n’ont pas visé à côté pour le premier tour de l’élection présidentielle française qui se déroulait dimanche 23 avril. Contrairement aux outils de prévision utilisant la « big data ».

Les derniers sondages publiés vendredi donnaient Emmanuel Macron entre 23 et 24%, Marine Le Pen entre 22 et 23%, François Fillon entre 19 et 21%, Jean-Luc Mélenchon entre 18 et 19,5% : nous sommes très proches de la fourchette des estimations données dimanche soir vers 22 heures.

« Ils avaient également constaté une hausse régulière du taux de participation, passé en dix jours de 65 à 75% pour finalement s’établir autour de 78% », souligne le quotidien économique Les Echos.

Bide Data

Or, Predict My President, ce programme mené par des étudiants de Télécom Paris Tech, ou encore Filteris, une PME canadienne, donnaient Fillon et Le Pen gagnants du premier tour. Leurs algorithmes d’analyse des données issues de Twitter, Facebook et autres réseaux sociaux ont pourtant fonctionné en vain. Même constat pour l’application participative Gov, qui permettait à ses utilisateurs de donner leur opinion sur les débats quotidiens et d’évaluer les candidats.

Il y a quelques jours encore, les concurrents utilisant des techniques d’analyse à partir de la collecte des méga données (big data) se voyaient bien uBériser les traditionnels instituts de sondage. Ils ont su prédire la qualification de François Fillon au premier tour de la primaire à droite, l’élection de Donald Trump ou encore la victoire du Brexit. Confiants, les prédictions de Filteris, de Vigiglobe et de l’algorithme Predict My President annonçaient tous un second tour Le Pen-Fillon.

Filteris s’est fait connaître en développant une expertise dans l’analyse du buzz généré sur le web et les réseaux sociaux dans des contextes électoraux, baptisée « BuzzPol ». BuzzPol réalise, comme les sondages, des mesures régulières de l’opinion. Contrairement aux sondeurs, BuzzPol ne se base pas sur le recueil d’intentions de vote auprès d’un panel de votants représentatif, mais sur l’analyse à grande échelle des perceptions, avis et opinions exprimés sur le web et les réseaux sociaux. Son algorithme permet d’analyser ces points de vue de manière quantitative et qualitative, puis de générer un score sur 100, réparti entre les candidats.

Et pourtant, les indications des data collectées sur les réseaux sociaux n’ont pas su donner lieu à une prévision exacte à l’issue du premier tour du scrutin. Le chercheur Nicolas Vanderbiest explique sa méthodologie : « Tous les résultats de Twitter ont été obtenus par Visibrain. Visibrain a collecté tous les tweets de la présidentielles et j’ai pris toutes les données du 14 février au 16 avril. Pour tout ce qui n’est pas Twitter, j’ai utilisé le panel de Radarly (pour la même période temporelle) ainsi que les données de Talkwalker pour le tableau Facebook (Dernier moi. Les données sont du 13 novembre au 22 janvier. D’autres données ont été comparées avec Brandwatch. ». Il en ressort qu »avec le meilleur taux d’engagement sur Twitter et Facebook, le plus grand nombre de personnes ayant un intérêt selon Facebook, le plus grand nombre de vues sur YouTube, la plus grosse communauté lors des débats, Jean-Luc Mélenchon surpasse tout le monde« . Or, le candidat de La France Insoumise a terminé dans le rôle du quatrième homme.

Le problème est que la mesure sur les réseaux sociaux valorisent les candidats dont les militants sont les plus actifs sur ces réseaux, cela sans préjuger du vote des électeurs, et sans se soucier s’il s’agit bien d’électeurs. Parmi les sympathisants de Mélenchon sur Twitter, beaucoup sont lycéens, et donc mineurs pour la plupart.

Quant aux courbes de Google Trends, qui mesurent les requêtes sur le moteur de recherche, elles fournissent des indications difficiles à interpréter : le fait qu’elles aient fait apparaitre ces dernières semaines un très fort volume de recherches pour Emmanuel Macron et Jean-Luc Mélenchon ne signifie pas que ces recherches se transforment en engagement pour l’un ou l’autre candidat dans les urnes.

En vue du second tour, le 7 mai, les instituts de sondage vont devoir confirmer leur rigueur analytique.

The following two tabs change content below.
redaction

redaction

CM (animateur de communauté sur les réseaux sociaux) / Correspondant(e)s à l'étranger / Contributeurs/trices occasionnel(l)es / Stagiaires JRI et stagiaires presse écrite dans la rédaction pour moins de 3 mois.

Vous pouvez également lire