Les Chi² partiels : un indicateur utile pour explorer l’association entre deux variables nominales

Le test du Chi² pour vérifier l’existence d’une association entre deux variables nominales

Appartenant aux méthodes explicatives, le test Chi² est utilisé dans les analyses bi-variées ayant comme objectif d’identifier s’il existe ou non une association entre deux variables nominales (appelées également qualitatives ou fermées), autrement dit si l’appartenance à certaines modalités de la première variable influence ou non l’appartenance à d’autres modalités de la deuxième variable.

Si l’on prend l’exemple ci-dessous de la consommation du fromage, il serait intéressant de connaître les préférences en matière de fromage par origine géographique et de vérifier s’il existe, sur le plan statistique, une association entre les deux variables.

 

 Figure 1 : Tris à plats des variables à étudier

Le test du Chi² se base sur une comparaison d’effectifs et  s’applique sur des tableaux croisés, appelés tableaux de contingence, contenant en ligne les modalités de la première variable et en colonne les modalités de la seconde.

Figure 2 : Tri croisé des variables à étudier

Après une phase de calcul de la valeur du Chi² et de comparaison de cette valeur à un seuil théorique (les logiciels d’analyse de données effectuent ces opérations sur simple activation du test statistique), il est possible de tirer une conclusion générale sur l’association entre les variables étudiées.

Dans l’exemple précédent, l’application du test statistique génère le résultat suivant, qui conclue à l’existence d’une association très significative entre l’origine géographique et le type de fromage préféré.

p = <0,01 ; Khi2 = 60,36 ; ddl = 3 (TS)

La relation est très significative.

Toutefois,  cette conclusion ne précise pas les couples de modalités responsables de cette association. Pour répondre à la question « quels types de fromages préfèrent les Français et les Savoyards ? », c’est la notion de Chi² partiel qui peut apporter ce complément d’information.

Les Chi² partiels pour identifier les couples de modalités associées

Les Chi² partiels explorent le tableau de contingence à la recherche de cellules qui représentent des écarts par rapport aux effectifs théoriques obtenus en cas d’indépendance entre les variables étudiées.

En réalité, toutes les cellules du tableau présentent des écarts, ceux-ci sont plus ou moins élevés. Certaines cellules correspondent à des écarts faibles et sont par conséquent ignorées dans l’explication de l’association entre les variables étudiées.

D’autres correspondent à des écarts élevés pouvant être positifs ou négatifs ; les écarts positifs indiquent l’existence d’une sur-représentation et les négatifs renvoient à une sous-représentation des catégories qualifiées par les différents couples de modalités. Ces cellules expliquent l’association entre les variables étudiées.

Figure 3 : Tableau des effectifs réels et théoriques

Les Chi² partiels permettent de hiérarchiser ces écarts selon leur importance et d’indiquer leur poids dans l’explication de l’association. Les cellules correspondantes sont alors mises en évidence.

Figure 4 : Tableau des significativités

Il est à noter que le logiciel Sphinx iQ attribue les notations suivantes pour qualifier les cellules : TS indique que le couple de modalités contribue d’une manière très significative à l’explication de l’association, S indique que la contribution est significative et PS indique une contribution peu significative. Ces notations sont positives ou négatives selon que les effectifs des cellules sont sur ou sous représentés.

Pour revenir à l’exemple précédent, les Chi² partiels indiquent que les fromages à pâtes pressées cuites ne sont pas responsables de l’association entre les deux variables que sont les types de fromage préféré et l’origine géographique (aucun symbole associé), que les Savoyards ont une préférence très nette pour les fromages à pâtes pressées non cuites (+TS), que les Français préfèrent d’abord les fromages à pâtes molles (+TS) et ensuite les persillés (+S).

Pour conclure

L’analyse des Chi² partiels apporte un complément d’information utile à la compréhension de différents aspects de l’association entre deux variables (les couples de modalités responsables de l’association et intensité des liens) permettant ainsi la mise en place de plans d’actions pertinents.

Ces informations sur les Chi² partiels peuvent être utilisées dans le cadre d’analyses plus globales se rapportant à la fouille des données. Ceci est rendu possible grâce aux technologies utilisées par les logiciels d’analyse de données (voir un exemple d’application avec les Key-view).

>>> Plus d'informations sur www.lesphinx.eu

Share and Enjoy:
  • Print
  • Digg
  • StumbleUpon
  • del.icio.us
  • Facebook
  • Yahoo! Buzz
  • Twitter
  • Google Bookmarks

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>