Méthodos

29 janvier 2024

Blog

#Analyse

#Multivariée

#Données

Au moment d’analyser les réponses à un questionnaire ou les données retranscrites d’entretiens, ces données deviennent des « variables » à partir desquelles des analyses statistiques sont effectuées.

Mais que se passe-t-il lorsque nous souhaitons étudier simultanément plus de deux informations, soit plus de deux variables à la fois ? C’est à ce moment-là que les analyses dites « multivariées » entrent en jeu.

Peu utilisées dans les études menées dans le monde professionnel car souvent considérées comme trop abstraites, ces analyses peuvent néanmoins se révéler très informatives lorsque l’on sait les utiliser. Dans cet article, nous tenterons de les rendre plus accessibles, en nous concentrant non pas sur les formules de calcul, mais plutôt sur la pertinence opérationnelle de certaines de ces méthodes, qui permettent de répondre à trois objectifs distincts.

 

I – Objectif n°1 des analyses multivariées : expliquer

 

a) Principe

Comme pour les analyses bivariées (aussi appelées tris croisés), l’objectif principal des analyses multivariées est de comprendre comment une variable peut être influencée par une série d’autres variables.

 

b) Les techniques multivariées

La régression multiple

La méthode d’analyse dite de régression multiple s’applique uniquement aux variables numériques, c’est-à-dire :

Cette technique va chercher à identifier les relations que les différentes variables entretiennent entre elles. C’est-dire qu’elle va chercher à identifier dans quelle mesure les variables que l’on introduit en tant que variables explicatives (= variables indépendantes), permettent de prédire les données observées sur la variable dite à expliquer (= variable dépendante).

Matrice de régression linéaire multiple

Exemple de matrice à régression linéaire multiple réalisée sur Sphinx iQ 3

 

Pour illustrer comment interpréter les résultats d’une régression linéaire, prenons l’exemple de la question suivante : « Quel a été votre budget pour les vacances ? ».

Dans cet exemple, nous cherchons donc à comprendre comment le budget total alloué aux vacances est prédit par :

  • le budget alloué aux loisirs
  • le budget alloué à l’hébergement
  • le budget alloué à l’alimentation
  • et le budget alimentation spécifiquement alloué aux sorties restaurant

Sur le graphique ci-dessus, les résultats obtenus permettent de mettre en évidence des coefficients via une équation. Ainsi, nous voyons que la variable « Pour les loisirs » est celle qui impacte le plus l’analyse. À l’inverse, la variable « pour le restaurant » n’a que peu d’influence sur le budget vacances. Nous pouvons alors en déduire que les répondants ont ainsi majoritairement dépensé pour leurs loisirs que pour le restaurant.

 

La matrice importance-performance

La matrice importance-performance, souvent utilisée dans les enquêtes de satisfaction, permet de mettre en relation la satisfaction du répondant et l’importance qu’il accorde aux différents critères évalués. Cette méthode d’analyse conduit ainsi à la production d’une carte, où chaque critère est placé sur deux dimensions :

  • la performance sur l’axe horizontal à mesurée par la note moyenne (sur 10) du critère
  • et l’importance sur l’axe vertical à mesurée par le coefficient de corrélation* avec l’indice de recommandation interne.
Matrice importance-performance

Exemple de matrice importance-performance réalisée sur Sphinx iQ 3

 

Nous pouvons interpréter cette matrice de la manière suivante :

  • En haut à droite, les points forts. L’entreprise de formation est jugée positivement sur des critères très importants pour les clients. Il s’agit ici principalement de l’enseignant, des modalités et des TD.
  • En bas à gauche, la zone neutre. Ces critères ne sont pas très bien perçus, mais ils sont peu importants.
  • En bas à droite, la zone sur-qualité. Ces critères sont bien évalués, mais ils sont d’une importance moindre pour les clients.
  • En haut à gauche, la zone de progrès. Elle indique les critères importants, insuffisamment bien perçus par les clients. Ces sont ces critères sur lesquels l’entreprise doit s’améliorer en priorité.

Découvrez comment mettre en place une analyse importance/performance dans le logiciel Sphinx iQ 3

 

 

II – Objectif n° 2 des analyses multivariées : synthétiser

 

a) Principes

Le deuxième objectif des analyses multivariées est de simplifier les données en identifiant les variables ou modalités qui sont similaires, c’est-à-dire celles qui mesurent la même chose. Nous pouvons ainsi définir ces groupes de variables « corrélées », afin de restituer les résultats d’un point de vue plus synthétique, et donc plus simple.

 

b) Les techniques multivariées

L’analyse factorielle en composante principale (ACP)

L’analyse factorielle en composante principale, ou ACP, est surtout utilisée pour observer les questions redondantes ou celles qui mesurent la même chose car fortement corrélées entre elles.

Par exemple, dans une enquête de satisfaction, la première question portant sur l’accueil au téléphone et la deuxième question portant sur la disponibilité des interlocuteurs représente la même chose : l’accueil commercial. Tel est le principe central des analyses factorielles. Elles permettent ainsi de synthétiser l’information, puis de la restituer sur un plan à deux dimensions qui sera plus facile à lire.

Analyse factorielle en composante principale (ACP)

Exemple d’analyse factorielle en composante principale (ACP) réalisée sur Sphinx iQ 3

 

L’analyse factorielle des correspondances (AFC)

L’analyse factorielle des correspondances, ou AFC, s’applique aux variables nominales ou catégorielles des questions fermées. Cette technique d’analyse permet de s’intéresser non pas aux combinaisons de variables, mais aux combinaisons de modalités qui sont liées statistiquement. L’AFC est utilisée surtout pour croiser simultanément plus de deux variables nominales.

Les analyses factorielles étudient ainsi l’inertie du nuage de points ayant pour coordonnées les valeurs présentes sur les lignes du tableau de données. La forme du nuage et la distribution des points le long des axes d’inertie fournissent ainsi une lecture plus claire et une structuration hiérarchique des informations contenues dans un simple tableau.

Analyse factorielle de correspondance (AFC)

Exemple d’analyse factorielle de correspondance réalisée sur Sphinx iQ 3

 

Par exemple, le graphique ci-dessus illustre les différents verbatims des répondants en fonction des années. Nous pouvons ainsi, grâce à l’analyse AFC, faire correspondre ces verbatims à une année en particulier. Nous remarquons alors que l’année 2 fait plutôt référence aux loisirs, contrairement à l’année 1 qui illustre plutôt le télétravail.

 

Découvrez comment mettre en place une analyse factorielle des correspondances dans le logiciel Sphinx iQ 3

 

 

III – Objectif n°3 des analyses multivariées : Classifier

 

a) Principe

Enfin, le troisième objectif des analyses multivariée est de classifier les données récoltées. Ainsi, ces méthodes de classification s’intéressent non pas aux variables mais aux individus. Toujours dans un objectif de simplification, ces analyses cherchent à identifier des groupes de répondants aux comportement similaires.

 

b) Les techniques multivariées

Les analyses typologiques ou classification

Pour les analyses factorielles présentées ci-dessus, il s’agissait de regrouper les variables (ACP) ou les modalités (AFC) afin de simplifier les restitutions des résultats. L’analyse typologique permet quant à elle de procéder de la même manière, mais sur des individus. En effet, elle permet de repérer des groupes de personnes dont les réponses sont similaires afin de restituer les résultats d’une enquête de manière simplifiée.

Analyse typologique

Exemple de matrice pour classer les données récoltées dans les avis clients réalisée sur Sphinx iQ 3

 

Dans l’exemple ci-dessus, la matrice restitue les résultats d’une enquête de satisfaction client. Grâce aux avis récoltés, le graphique permet de regrouper les clients en 3 classes différentes : les ambassadeurs, les détracteurs et les clients à risque.

Ainsi, nous remarquons que les points d’amélioration pour augmenter la satisfaction client (clients détracteurs) sont avant tout la joignabilité, la rapidité et l’attente du service client de l’entreprise en question.

 

Conclusion

Finalement, bien que rarement utilisées, les analyses multivariées permettent de dégager et de représenter efficacement les informations essentielles contenues dans les résultats d’une enquête. Elles requièrent cependant une capacité d’interprétation et donc une excellence compréhension du sujet de l’étude. Par ailleurs, elles nécessitent un certain talent dans la mise en forme des résultats, pour que les chiffres et les statistiques se transforment en informations utiles à la connaissance et à la prise de décision. Le logiciel d’enquêtes et d’analyses Sphinx iQ 3 permet de réaliser tout type d’analyses multivariées afin de donner une nouvelle dimension à vos résultats. Besoin d’aide pour mettre en place une analyse multivariée ?

 

Contactez-nous pour échanger sur vos besoins avec nos experts études 😉 !

 

______________

*Un coefficient de corrélation est un indice borné entre 0 et 1 qui représente l’association existante entre deux variables. Plus la corrélation est forte (proche de 1) entre un critère et l’indice de recommandation interne, plus on peut dire que ces variables sont liées et donc plus le critère est important.

Haut de la page