Sondages Le Pen et Mélenchon : pourquoi le bug ?
400 sondages politiques ont été publiés avant le premier tour de l'élection présidentielle. En 2007, il n'y en avait eu qu'environ 300, et 200 en 2002. Cette profusion d'enquêtes d'opinion n'a pas permis aux sondeurs d'anticiper avec beaucoup plus de justesse que les années précédentes les scores obtenus par certains candidats dimanche, 22 avril. Le résultat de Marine le Pen a été largement sous-estimé par la plupart des sondages les plus récents, et celui de Jean-Luc Mélenchon clairement surestimé. Pourquoi ? Les sondeurs, interrogés par @si, sont partagés.
Abonnez-vous pour pouvoir commenter !
si vous êtes déjà abonné Connectez-vous Connectez-vous
Derniers commentaires
BVA travaillait pour le Parisien sur un échantillon de 2161 personnes, ce qui était censé restreindre la marge d'erreur: celle-ci devait, selon eux (cf document que je donne en lien) être réduite à 1,8 (au lieu de 2,5 sur des échantillons de 1000 personnes).
Or leur dernier sondage avant le 1er tour indiquait ceci: Hollande: 30 Sarkozy: 26,5 Le Pen : 14 Mélenchon: 14
Bref, plantage assez manifeste. Alors que la Sofres, dans le document montré par Dan, était plus proche de la réalité finale: Hollande: 27 Sarkozy: 27 Le Pen : 17 Mélenchon: 13
Est-ce à dire que pour BVA la méthode de constitution de l'échantillon, de "cuisiner" le sondé, de redresser les chiffres était pourrie?
De plus, est-ce que leurs calculs en fonction des catégories sociales ne sont pas désuets (cf post de Cécile Clozet)
Comment se fait-il aussi que le même institut pour le 2e tour passe de FH 57/NS 43% la semaine dernière à FH 53/NS 47% cette semaine, alors que les prévisions pour le 2e tour sont censées être plus béton et plus fiables?
La mobilité interne des français a explosé : les pauvres sont rejetés au delà des banlieues, vers des zones périurbaines récemment encore considérées comme des zones "rurales"... la composition socio-économique de ces communes est bouleversée, et donc la structure des votes. Les petits bureaux qui ferment à 18:00 heures ne votent plus du tout comme il y a 5 ou 10 ans, et faussent les estimations à partir des premiers résultats.
A l'arrivée, le score de Mélenchon est de " x-n " %. Et les journalistes, les analystes politiques, les présentateurs etc disent que c'est lui qui s'est planté.
Beaucoup savent que, grâce à cette loi de la gravité, on a pu perfectionner un grand nombre d'objet mécanique. A commencer par les voitures, les avions, etc etc.
Et puis, on connaît un peu moins les lois des la relativité.
Certains en ont entendu parler, assez vaguement. C'est, pour beaucoup, l'histoire d'un homme qui tire la langue, et guère plus. Bref, une histoire de farfelus...
Mais, pour ceux qui travaillent ou ont construit des centrales nucléaires, cette loi a plus de sens. Dit autrement : un/une ingénieur(e) qui construirait des réacteurs nucléaires en appliquant les lois de Newton aux processus atomiques seraient pris pour un/une grand(e) farfelu(e) ; voire un(e) danger publique.
Maintenant, qui connaâit la loi des grands nombres ? Vous savez, l'une de ces lois qui s'appliquent en probabilité - branche des mathématique. Mais, comme toute loi, elle a son champ d'application.
Elle postule la vérité suivante : si on lance un dé à six faces, bien équilibré, bien sous toutes ses formes, si on le lance, disais-je, 1000 fois, on pourrait mesurer certaines fréquences d'apparitions. Si on le lance à nouveau 1000 fois, on aurait d'autres mesures de fréquences. Mais, comme on aurait le temps, on le lancerait 10 000 fois ; puis 50 000 fois, puis 5 000 000 de fois. Et là, on observerait que ces fréquences semblent s'équilibrer... vers une valeur théorique : la fameuse "Une chance sur six".
Mais maintenant, si on observe une situation et que - cela peut arriver, n'est-ce pas - il n'y a pas de valeur de stabilisation, eh ben, il faut l'admettre : la loi des grands nombres ne peut pas s'appliquer.
Ainsi, le regretté Benoît Mandelbrot avait conclu cela au sujet des analyses financières : les cours de la bourses n'obéissent pas à la loi des grands nombres. Le livre "Fractales, hasard et finance (1959-1997)" décrit tout cela très bien.
Alors voilà : les sondeurs ont, sur la base de leur obersation, déduit un certain nombre de mesure... Les extrapolations sont totalement erronées. Ainsi - mais on le sait depuis longtemps, la loi des grands nombres ne peut pas s'appliquer.
Mais plutôt que de les décrire comme des ingénieurs farfelus, on préfère les garder près de nous : leur poésie des nombres est sans limite...
Marc Olive
Mathématicien - Avignon
Mais si un sondeur m'interroge à un moment "m" : je dis soit l'un soit l'autre. Quand les chiffres pour Mélenchon sont hauts, ceux pour Hollande devraient être plus bas.
Il est par contre plus inquiétant d'entendre les commentateurs politiques dire que le FN entre 2002 et 2012 a progréssé de plus de 900 000 voix en oubliant de compter les voix de B.Megret qui en 2002 avait réalisé près de 400 000 voix!
Quand on remarque les bons scores du FN dans des communes rurales dont la population n'a certainement jamais vu un "arabe" ou un "noir" cela en dit long sur cette population rurale et son état d'esprit certes une population qui souffre et qui travaille plus que la moyenne dont les chômeurs de l'unité familiale sont certainement nombreux. On peut comprendre,leur rejet des politiques qui les gouvernent et leur vote FN .
Comme on peut comprendre le désarroi des ouvriers de la sidérurgie qui ne voient les "partis politiques" PS etUMP qu'au moment des élections!
mon coeur n'est pas à maman Parisot (qui est vice-présidente d'IFOP), mais en ces temps difficiles il est toujours bon de savoir qu'à droite, certains restent honnêtes.
Quoi le Pen, et ses 17,9%, ah bon? et alors vous ne saviez pas qu'il y a toujours eu des mecs comme çà, qui se réveillent quand on les existe,
Seulement voilà le drame, nos prédicateurs et leurs oies sauvages sont à leur tour perturbées par les changements climatiques, les madames soleil subissent les caprices de la météo., le phénomène twitter, le scoop qui tire plus vite que son ombre, et ceci et cela,
Que diable ! bâillonnez nos experts qui jactent en continu 24H/24H 365 jours sur 365 jours à tous les endroits de la planète, demandez à Pénélope qu'ils arrêtent de défaire ce qu'ils ont dit la veille? etc.
J'invite également les asinautes curieux a visionner l'émission "Ce soir ou jamais" du 17 avril.
=> http://ce-soir-ou-jamais.france3.fr/?page=emission&id_rubrique=1556
et la campagne éhonté des journaux (mélenchon buisson, melenchon bachar el assad etc ...)
sur le pen a partir du moment ou on disait que Sarkozy s'éssouflait dans les sondages, je n'osais le croire mais le sentait venir, en plus quand Sarkozy a apellé les électeurs modem et fn aux vote utile je me suis demandé s'il n'était pas plus bas que ça dans les sondages.
Pour moi, les journalistes préfèrent commenter "la course de petits chevaux" et regardent pas ou peu l'abstention. En conséquence, les sondeurs ne font pas franchement d'effort sur celle-ci, alors qu'elle est aujourd'hui une des composantes majeures d'une élection.
En réalité, il y a eu aucune surprise dans ce scrutin. Le Pen a principalement récupéré les électeurs qui étaient partis chez Sarko en 2007...
Est-ce trop demander aux journalistes qui nous abreuvent des sondages à longeur de journée d'avoir le niveau d'un élève de seconde sur le sujet?
Cela commencerait par ne plus citer de sondage sans citer aussi les marges d'erreurs.
détail : cheminade était donné 1000/1 comme président...
sûr que ça m'aurais remonté le moral.
non ?
(nb : je rappelle, parce qu'apparemment il y a que pow wow qui est allé voir, c'est un site anglais, et donc je suppose essentiellement des parieurs anglais)
ah pas bête, c'est une nouvelle thérapie qui nous viens de pays lointains?
quand je pense au nombre de fois où je n'ai pas perdu au loto, tiercé, poker, bingo, roulette russe.. euh ...non, pas roulette
russe... ben mon vieux quel chanceux je fais... ;-)
PS: finalement si, la roulette russe aussi: j'aurais encore été foutu de gagner ce jour là...
Les instituts de sondages,c'est quand même des gens capables de vous vendre une bagnole en vous disant elle roule à 140, non à 150, non 130.
Et il y a des cons qui les achètent, leur sondages.
attention, il y a plusieurs choses différentes à ne pas confondre :
1 - le sondage, qui a été réalisé jusqu'à l'avant veille (je crois) de l'élection qui est l'interrogation de personnes (par différentes méthodes : téléphone, internet etc) et qui se base sur des intentions de vote déclarées ==> au-delà de l'erreur statistique (dont vous parlez et dont les instituts veulent bien parler... pourquoi ne parlent-ils que de cette erreur là? ce serait une question pertinente à se poser) il y a un risque d'erreur qui provient du 'déclaré' qui n'est pas forcément ce que la personne va réellement faire et c'est là-dessus (aussi) qu'il y a des redressements afin de limiter cet écart entre déclaratif et comportement effectif. Par exemple, avant, on savait que les électeurs du FN ne déclaraient pas facilement leurs votes donc on sur-estimait ces déclarations, le tout est de savoir dans quelle mesure, avec quel poids il faut les surestimer. Aujourd'hui les choses semblent avoir évoluées, mais dans quelle mesure et avec quel poids? je pense que c'est là la difficulté, on reste sur du mouvant...
2 - les 'sorties des urnes' qui sont en fait des estimations à partir de bureaux tests et sur des bulletins de vote dépouillés. , donc des votes réels : et ce sont ces estimations qui ont été fournies à 20h sur les différentes chaines ==> il s'agit ici de bien choisir ses bureaux de vote et d'avoir un 'modele' statistique qui permet d'extrapoler (cela est différent du point 1 même s'il y a un échantillon qui est aussi créé et donc aussi des risques d'erreur)
je rajouterai : dans ce second cas, pour moi, il y a différentes choses qui peuvent jouer:
- pas suffisamment de bureaux de vote sélectionnés (question de coûts, de délais??)
- pas les bons bureaux de vote choisis (je ne pense pas que cela vienne des zones régionales car l'on retrouve les votants Le Pen dans les mêmes régions qu'avant)
- le fait que justement le vote Le Pen est maintenant (plus qu'avant? ce serait à vérifier) plutôt rural ou petites villes et que justement ce sont ces bureaux de vote qui ont fermé le plus tôt et qui ont été dépouillés le plus vite, d'où sur représentation dans un 1er temps?
- peut-etre d'autres choses?