. . . . OVIPAL - OBSERVATOIRE DE LA VIE POLITIQUE EN ALSACE . . . .

.       .   . . OVIPAL - OBSERVATOIRE DE LA VIE POLITIQUE EN ALSACE . . . .

Oh ! Les chiffres, moi vous savez... le point de vue d’un statisticien

 

Par Jean-Paul Villette (ovipal), Maitre de conférences, Université de Strasbourg

 

1-   lire l’étiquette d’un sondage

un exemple : sondage BVA pour Le Parisien-Aujourd'hui en France publié dimanche 16 mars 2014. Dans cette étude, réalisée les 13 et 14 mars auprès d'un échantillon de 997 personnes représentatif de la population française âgée de 18 ans et plus (méthode des quotas), recrutées par téléphone et interrogées par internet,

 

-        combien de personnes ont répondu ?

 

      Impossible de savoir : « auprès »  est une expression poétique. Il faut faire  des milliers d’appels pour obtenir que 1000 personnes décrochent et ne raccrochent pas aussitôt. L’application de filtres fait facilement tomber le nombre de répondants à quelques centaines. Exemple de filtre, pour l’Election présidentielle de 2012, un premier filtre était d’avoir voté en 2007 et le deuxième d’être certain d’aller voter en 2012.

 

Ici on ne sait rien.

 

-        pourquoi 997 ?

 

C’est du marketing, ça fait sérieux sans doute. On peut obtenir  des résultats utiles avec de très petits échantillons, c’est souvent  le cas dans l’industrie, dans les sciences de la vie. Par exemple, des scientifiques ont trouvé que tous les individus peuvent être classés en 3 groupes distincts, 3 « entérotypes », selon la nature des bactéries hébergées par le tube digestif... avec des échantillons de quelques dizaines d’individus (http://www2.cnrs.fr/presse/communique/2165.htm).

 

- échantillon représentatif ?

 

Ça ne veut rien dire. Représentatif (un synonyme est « proportionnel »)  de quoi ? du genre ? alors la proportion  hommes/femmes de l’échantillon serait celle de la population, de l’âge… ? Quelle est la « variable de contrôle » ?

Pour un statisticien, l’expression un « échantillon représentatif », avec des guillemets, c’est à dire des pincettes, signifie qu’il permet, par des formules de calcul complexes d’avoir une estimation sans biais systématique de la variable mesurée. Il y un biais (une erreur, un écart entre la vraie valeur et la valeur estimée) mais il n’est pas systématique, c’est à dire qu’en gros la surestimation est aussi probable que la sous-estimation

 

-        des quotas ?

 On ne dit pas des quotas de quoi. Il y a une bonne idée et une bonne pratique. Qu’un individu ne soit pas tiré complètement au  hasard, mais avec une probabilité conditionnelle à son genre, la taille de son agglomération, sa région …permet d’obtenir une estimation de bien meilleure qualité, en redressant les estimations par des coefficients basés sur la population. 

 

Voici la formule la plus simple avec une seule variable de contrôle :

 

Une variable de contrôle définit des catégories i=1,…I. Dans la catégorie i, dans la population, il y a Ni individus et ni individus dans l’échantillon. Un plan de sondage est  ( n1,n2,…,ni,….nI).La valeur de la variable X pour l’individu k de la catégorie i est xi,k.

 

Quel que soit le plan de sondage, on peut calculer une estimation sans biais x* de x.

 

 

Estimation de la valeur moyenne dans la population:

 

https://static.blog4ever.com/2014/01/762002/sondage-image-1.png

 

Dans la pratique on ne respecte pas les quotas, c’est à dire à dire que les proportions dans l’échantillon de différentes variables de contrôle ne sont pas celles de la population parce que

 

1-     ce n’est pas possible ou alors ce serait extrêmement couteux (on peut chercher longtemps l’agriculteur de 30 à 50 ans qui nous manque)

2-     cela n’est pas nécessaire car les formules corrigent automatiquement les sur- ou sous-représentativités dans l’échantillon

3-     surtout, cela n’est de toute façon pas souhaitable , on obtient de bien meilleures estimations en appliquant la « règle d’allocation de Neyman ».

 https://static.blog4ever.com/2014/01/762002/sondage-image-2.png

 

Alors un institut de sondage peut dire n’importe quoi ?

 

oui ! La liberté est totale. Il n’est même pas obligé d’interroger qui que ce soit.

 

Mais il y existe une « commission des sondages «

 

oui… Mais elle n’est, en gros, concernée que par les « sondages publics d’intention de vote susceptibles d’altérer la sincérité du scrutin ». Voir son site

http://www.commission-des-sondages.fr/

 

 

Un Institut de sondage qui dirait n’importe quoi, ça se saurait. Il perdrait toute crédibilité 

 

Des enquêtes montrent que la confiance envers les Instituts de sondage est  globalement faible. Est-ce qu’un Institut qui fait un coup tordu risque d’en pâtir ? J’ai entendu cette question, posée à un responsable d’un grand institut de sondage à propos de l’IFOP, qui avait fait fort en 2012 (N. Sarkozy en tête dans les intentions de vote, sondage pour le Figaro). Je ne sais pas ce qu’il en est. J’ai compris de sa réponse que tous les instituts en pâtissent, pas spécialement le fautif.

 

 

                                                                            A suivre

 

 

PS- pour ceux qu’intéresse l’obscure clarté des nombres, un site de statisticiens : 

http://www.penombre.org/

 

 



18/03/2014
0 Poster un commentaire

A découvrir aussi


Inscrivez-vous au site

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 866 autres membres