Institut

25 octobre 2024

Blog

#Tests statistiques

#Analyse

#bivariée

L’objectif d’une analyse bivariée est d’étudier les relations entre 2 variables. Elle permet de savoir s’il y a un lien entre les réponses qui sont faites à 2 questions différentes.

En fonction des 2 variables à croiser, un test statistique particulier est à mettre en œuvre afin d’étudier au mieux la relation entre ces 2 variables. Cependant, le choix du test dépend de la nature des variables.

Quelle que soit la nature des variables étudiées, une analyse croisée doit passer par trois niveaux d’interprétation :

  • D’abord, l’étude de l’existence de la relation entre les deux variables,
  • Ensuite, si relation il y a, celle-ci est-elle moyenne, forte ou très forte.
  • Enfin, comment se traduit-elle dans les faits ?

Dans cet article nous vous expliquons les 3 principaux tests statistiques, et comment interpréter les résultats avec un exemple concret d’application.

 

 

I – Le test du Chi²

 

a) Définition du test du Chi²

Le test du Chi² est le croisement de 2 variables fermées avec des catégories. Il permet de savoir si ces variables sont interdépendantes, c’est-à-dire s’il y a un lien entre les deux. Il se base sur la comparaison d’effectifs réels avec des effectifs théoriques.

Si la différence entre ces deux fréquences est significative, nous pouvons conclure qu’il existe une relation entre les deux variables étudiées, et que les différences ne sont probablement pas dues au hasard.

 

b) Interpréter les résultats d’un test du Chi²

 Pour bien interpréter les résultats d’un test du Chi², il convient de comparer le Chi² calculé à une valeur repère à dépasser, qui est le Chi² théorique.

Ainsi, si la valeur du Chi² calculé est supérieure à la valeur du Chi² théorique, alors il existe une relation entre les deux variables avec un risque d’erreur p (p étant la probabilité de se tromper en affirmant que la relation est significative).

Pour juger de la force de la relation, il faut ensuite comparer les valeurs du Chi² théorique en baissant progressivement le taux d’erreur p. Si le Chi² calculé reste significatif, cela traduit la force de la relation. Ainsi, plus l’écart est grand, plus le Chi² est élevé, et plus la relation entre les deux variables est forte.

 

c) Exemple d’application

Prenons l’exemple d’un tableau croisé qui représente le degré de satisfaction par note de recommandation (promoteurs, neutres, détracteurs). Nous nous retrouvons avec le tableau suivant :

Tableau croisé sur la répartition de la satisfaction par type de client

Le test du Chi² peut être utilisé ici pour vérifier s’il existe un lien entre la satisfaction et la note de recommandation. Dans ce cas, nous calculons les fréquences attendues pour chaque catégorie (le N TH, nombre théorique) en supposant que la note de recommandation et la satisfaction sont indépendantes. Nous arrivons sur le tableau suivant :

Exemple d'application du test du Chi²

 

Ici, nous nous retrouvons avec un Chi² calculé de 1572.9 et un Chi2 théorique de 24.10. La valeur du risque d’erreur p étant inférieure à 0.01, le résultat du test de Chi² est donc très significatif !

Nous pouvons donc conclure qu’il existe bien un lien fort entre la satisfaction et la note de recommandation.

 

II – Test de Fisher

 

a) Définition du test de Fisher

Le test de Fisher est utilisé dans le cadre d’une analyse croisée d’une variable fermée avec catégories avec une variable numérique. Il permet de comparer les moyennes en se basant sur l’analyse de la variance.

Avec un test de Fisher, nous cherchons à savoir s’il y a davantage de différences entre les groupes (variance inter groupe) qu’à l’intérieur de chaque groupe (variance intra groupe). Le rapport entre ces deux variances est alors appelé F.

Si la différence entre les moyennes est significative, nous pouvons conclure qu’il existe une relation entre les deux variables étudiées, et que les différences ne sont probablement pas dues au hasard.

 

b) Interpréter les résultats d’un test de Fisher

Pour interpréter le résultat d’un test de Fisher, il convient de comparer le résultat obtenu (F) à une valeur repère à dépasser, qui est le F théorique. Si la valeur du F calculé est supérieure à valeur du F théorique, il existe alors une relation entre les deux variables avec un risque d’erreur p (p est la probabilité de se tromper en affirmant que la relation est significative).

Pour juger de la force de la relation, il faut comparer les valeurs du F théorique en baissant progressivement le risque d’erreur p (dans la table statistique). Si le F calculé reste significatif, ceci traduit la force de la relation.

 

c) Exemple d’application du test de Fisher

Prenons un exemple où nous souhaitons savoir s’il existe une relation significative entre les origines d’une voiture (Française, Allemande…) et leur fiabilité (note sur 20).

Voici les données sous forme de tableau :

Exemple d'application du test de Fisher

Dans l’exemple ci-dessus, le F calculé est à 16.3 et le F théorique est à 3.8 avec un risque d’erreur à 1%. Donc nous avons bien une relation car le F calculé est largement supérieur au F théorique

 

III – Test de corrélation

 

a) Définition du test de corrélation

Le test de corrélation permet de mesurer la relation entre deux variables numériques. Il permet de déterminer si ces deux variables évoluent ensemble (relation positive), de manière opposée (relation négative), ou si elles sont indépendantes l’une de l’autre (absence de corrélation).

La technique mise en œuvre permet d’obtenir un nuage de points et une droite de régression des deux variables.

Le test de corrélation permet par exemple d’analyser la relation entre la satisfaction client (note sur 10) et la fréquence d’achat (nombre d’achats par mois).

 

b) Interpréter les résultats d’un test de corrélation

Le coefficient de corrélation, généralement symbolisé par « r », varie entre -1 et 1.

Ainsi, si r est :

  • Proche de +1, la corrélation est très forte, et les deux variables varient dans le même sens
  • Proche de -1, la corrélation est très forte, et les variables varient dans un sens inverse
  • Proche de 0, la corrélation est nulle, il n’y a donc aucun lien entre les deux variables.

 c) Exemple d’application

Imaginons que vous soyez responsable marketing d’une entreprise et que vous vouliez analyser la relation entre vos dépenses en publicité en ligne et l’évolution de vos ventes mensuelles. Le but est de savoir si l’augmentation des dépenses publicitaires impacte positivement vos ventes.

Supposons que vous disposiez des données suivantes sur une période de 12 mois :

 

 

Mois Dépenses en publicité Ventes (en unités)
Janvier 5000 € 120
Février 6000 € 130
Mars 4500 € 115
Avril 7000 € 150
Mai 6500 € 140
Juin 8000 € 160
Juillet 8500 € 170
Août 7500 € 155
Septembre 9000 € 180
Octobre 9500 € 190
Novembre 10000 € 210
Décembre 11000 € 220

 

Graphique représentant l'évolution des dépenses publicitaire par mois

 

En appliquant un test de corrélation, nous obtenons un coefficient de 0,95. Cela signifie qu’il y a une forte corrélation positive entre les dépenses publicitaires et les ventes. Plus vous investissez dans la publicité, plus vos ventes augmentent.

Cette corrélation forte suggère ainsi que l’investissement publicitaire joue un rôle important dans la performance des ventes. Cependant, il est essentiel de noter que la corrélation n’implique pas nécessairement une relation de causalité. D’autres facteurs peuvent influencer cette relation.

 

Vous souhaitez être accompagné et conseillé pour mettre en place des tests statistiques et comprendre les relations entre vos données ? Nos charges d’études sont à votre disposition !

 

 

Séparation

Rédigé par :

 

Séverine Pichollet Le Sphinx Séverine PICHOLLET

Chargée d’études senior chez Le Sphinx

Domaines d’expertise : dispositifs d’écoute client, enquête notoriété-image, gestion de panel et tests produits, enquêtes RH (climat interne, RPS)

Séverine évolue depuis plus de 15 ans au sein de l’Institut Sphinx, où elle a développé une expertise approfondie dans le secteur des Assurances et Mutuelles. Elle conçoit et met en œuvre des dispositifs d’enquêtes adaptés pour répondre aux enjeux stratégiques de ces acteurs. Par ailleurs, elle assure la gestion et le développement des relations avec une clientèle grands comptes.


 

Haut de la page