Institut

7 octobre 2024

Blog

#Échantillon

#Redressement

#Analyse

Lorsque vous menez une enquête, il est courant que les échantillons recueillis via les réponses à votre questionnaire ne reflètent pas fidèlement la population que vous avez ciblée. Et cela peut fausser vos résultats.

En tant que cabinet d’études, professionnel des sciences sociales ou encore du marketing, il convient donc de corriger ces biais afin d’obtenir des conclusions fiables et pertinentes.

Après vous avoir expliqué comment calculer la taille d’échantillon nécessaire pour obtenir des résultats significatifs, voyons maintenant comment corriger un échantillon. Que ce soit pour une enquête de satisfaction client, une étude RH ou une analyse de marché, nous vous expliquons dans cet article les deux principales techniques pour redresser un échantillon et améliorer ainsi la représentativité de vos données collectées.

 

I – Le redressement par pondération

 

a) Un poids deux mesures

La méthode du redressement par pondération est la plus souvent utilisée.

Lors d’un redressement par pondération, nous conservons toutes les réponses enregistrées de votre enquête, mais, pour le dépouillement, nous attribuons à chaque répondant un « poids » particulier en fonction de la catégorie à laquelle il appartient.

Ce poids est supérieur à 1 si la catégorie est sous-représentée et inférieur à 1 si celle-ci est surreprésentée. Ainsi, lors du dépouillement des résultats, l’avis d’un individu pèsera non plus 1 mais ce nouveau poids calculé.

Par exemple, si un échantillon comprend deux fois moins de femmes que prévu, le « poids » d’une femme sera de 2 et la réponse de chaque femme comptera double.

Pour chaque catégorie, il convient ainsi de calculer le poids à utiliser en vue du redressement par pondération

 

b) Exemple

Dans l’exemple ci-dessous, nous souhaitons que la population d’homme représente 49% de notre échantillon (proportion réelle des hommes dans la population française). Cependant, nous avons obtenu seulement 39% d’hommes lors du terrain. Le poids se calcule tout simplement en divisant la fréquence souhaitée par la fréquence obtenue, soit :

(49/100)/(39/100) = 0.49/0.39 = 1.2564.

 

Catégorie

Effectif obtenu

% obtenu

% souhaité

Poids utilisés par le redressement

Femme

140

61%

51%

0.8360

Homme

90

39%

49%

1.2564

Exemple d’un redressement par pondération

 

Nous appliquons ensuite les poids à l’ensemble de la base de répondants. Pour chaque variable de l’enquête, nous multiplions alors les effectifs obtenus par le poids de redressement de chaque catégorie. Nous obtenons ainsi de nouvelles fréquences « redressées ».

 

c) Pour aller plus loin : l’impact d’un redressement par pondération sur une étude

L’exemple suivant illustre ce principe de calcul.

Nous avons questionné deux populations (homme / femme) différentes sur leur intention de manger du chocolat à Pâques.

Sur l’échantillon obtenu (230 personnes dont 140 femmes et 90 hommes), nous observons que 70% des personnes envisagent de manger du chocolat à Pâques.

 

Pensez-vous manger du chocolat à Pâques ?

Nombre observé

% observé

Oui

161

70%

Non

69

30%

Total 230

100%

 

Selon le principe de redressement par pondération, nous appliquons les poids de pondération correspondant à la population femme (soit 0,8360, cf. tableau précédent) et à ceux de la population homme (soit 1,2564) afin d’obtenir de nouveaux effectifs « pondérés ».

 

Femme

Homme Total

Redressé

Oui

104×0.8360=86.94

57×1.2564=71.61 161=>158.59

68.9%

Non

36×0.8360=30.10 33×1.2564=41.46 69=>71.56

31.1%

Total

230

100%

 

Une fois le redressement effectué, la proportion de ceux qui envisagent de manger du chocolat à Pâques est de 68.9% au lieu de 70% précédemment. C’est bien ce pourcentage qu’il faudra utiliser et communiquer comme résultat de l’enquête.

 

 

II – Le redressement par extraction

Afin de retrouver les proportions attendues, c’est-à-dire celles de la population mère, nous pouvons supprimer aléatoirement des répondants parmi les catégories surreprésentées.

Pour ce faire, il faut donc réduire d’autant la taille globale de l’échantillon. C’est la méthode du redressement par extraction.

 

a) Le principe du redressement par extraction

Cette méthode de redressement est surtout utilisée lors d’une collecte de masse, à moindre coût (enquête via emailing, réseaux sociaux…). Avec un redressement par extraction, nous perdons cependant en précision dans la mesure où l’erreur associée augmente.

 

Echantillon souhaité

Echantillon obtenus

Echantillon redressé par suppression

Population A

145 (63%) 120 (52%)

120 (63%)

Population B

85 (37%) 110 (48%)

70 (37%)

Total

230 230

190

Erreur

5 points Non significatif

5.82 points

Echantillons souhaités, obtenus et redressés dans une enquête

 

Dans l’enquête exemple ci-dessus, nous conservons les 120 personnes de la population A dont, proportionnellement, le nombre est insuffisant, et nous en supprimons certaines de la population B afin qu’elle constitue seulement 37% de l’échantillon redressé.

Pour ce faire, il convient tout d’abord de retrouver la taille totale de l’échantillon en résolvant l’équation suivante :

120=(63/100) x X, soit x=190.

 

L’échantillon totale sera donc de 190 individus au lieu de 230.

Ensuite, il faut donc réduire la population B aléatoirement à 70 personnes (190-120). L’erreur passe donc de 5 à près de 6 points.

 

b) Extraction d’un échantillon représentatif a posteriori

Une fois l’enquête envoyée et les réponses récoltées, il faut extraire un échantillon représentatif selon les résultats obtenus.

Cela permet ainsi de constituer un échantillon représentatif à partir d’une grande base de réponses obtenues auprès d’un échantillon de convenance.

Par exemple, nous pouvons utiliser cette démarche dans le cadre d’une enquête hébergée sur internet et diffusée par mail. En effet, la collecte de données par internet garantit très rarement une méthode de sélection aléatoire dans la mesure où il est assez exceptionnel de disposer des emails de la totalité d’une population mère.

En revanche, cela permet de contacter rapidement et à moindre coût un grand nombre d’interlocuteurs.

Pour illustrer la méthode de redressement par extraction post enquête, et ainsi constituer un échantillon représentatif, prenons l‘exemple suivant :

 

c) Exemple

Nous voulons connaitre les comportements de consommation des jeunes de 14 à 25 ans d’une région donnée dans le domaine culturel (achats, téléchargements de vidéo, festivals, sites web spécialisés…).

Nous décidons d’envoyer l’enquête par mail et via les réseaux sociaux aux élèves et aux étudiants d’établissements scolaires et universitaires d’une région choisie ainsi que de Pôle Emploi et des résidences de jeunes travailleurs.

Nous disposons par ailleurs des statistiques de l’INSEE sur la répartition des jeunes de cette région, âgés de 14 à 25 ans, par sexes, âges et situations professionnelles, sur les départements de la région. La population mère ainsi délimitée représente environ 800 000 individus.

En un mois près de 3500 personnes ont répondu à l’enquête. Cependant, l’échantillon ainsi constitué n’est pas représentatif de la population mère. En effet, nous avons notamment moins de femmes que souhaité et plus de représentants des départements comprenant de gros centres urbains et des sites universitaires importants.

Ainsi, nous procédons à un redressement de l’échantillon « par extraction » à partir des quotas souhaités issus des statistiques de L’INSEE. Ce procédé revient à extraire, parmi les 3500 répondants, un groupe qui corresponde aux caractéristiques prédéfinies. Nous aboutissons finalement à un échantillon de 2180 personnes, représentatif des jeunes de la région âgés de 14 à 25 ans, sur les critères de l’âge, du sexe, du département et de l’activité professionnelle.

Nous pourrons ainsi nous fier aux résultats issus de cet échantillon redressé.

 

 

Vous avez besoin de conseils pour constituer et/ou redresser votre échantillon ?

Nos chargés d’études sont à votre disposition pour vous accompagner dans votre projet ! Contactez-nous !

 

 

Séparation

Rédigé par :

 

David BOURG

Directeur d’études à l’institut Sphinx

Domaines d’expertise : pilotage des projets d’études, conseils.

David est diplômé du Master Marketing Quantitatif de l’IAE de Grenoble. Il a près de 20 ans d’expérience dans les études marketing acquise en institut d’études en menant des projets auprès de grands groupes (dans le secteur des services notamment : Banque, Assurances, Telecom…),
Son rôle au quotidien : définir et piloter les projets d’études permettant à ses clients de prendre des décisions et de définir leur stratégie marketing. Il formule des recommandations suite aux problématiques soulevées par l’étude et apporte son expertise à ses clients.


 

Haut de la page