Analyse des débats des 2èmes tours des élections présidentielles de 1981 à 2012


L’étude de discours politiques fait figure de classique en matière d’analyse de données textuelles. Récemment, Le Sphinx a choisi de mener l’enquête sur les 5 débats des 2ème tours des présidentielles intervenus depuis 1981, afin d'en comparer les thématiques, les tonalités et les types de discours. L'analyse, de type qualitative et quantitative, a porté sur un corpus de plus de 120 000 mots, extrait des 5 débats officiels pour les 6 élections, étant donné qu’il n’y eut pas de débat à l'occasion du 2ème tour entre Chirac et Le Pen en 2002.

Corpus débats

La forme des débats

 Il est tout d’abord intéressant de se pencher sur la tournure de ces débats. Animés par des journalistes, ils sont de plus en plus longs et de plus en plus rythmés. Les graphiques ci-dessous mettent en évidence que les journalistes interviennent de moins en moins, et qu’au cours du temps, les échanges entre candidats sont de plus en plus brefs. Le dernier débat Hollande / Sarkozy est le plus long et le plus intense : les journalistes interviennent peu, les échanges sont plus nombreux et plus rapides.

Le contenu des débats

 Tout d'abord, les principaux champs sémantiques résultant de l’application du thésaurus mettent en évidence l’objet commun de ces discours. Les mots clés utilisés dans les débats respectifs montrent bien qu’il s’agit d’abord de la France et des Français, de président de la république et de problème de gouvernement….

Apparaît également nettement une spécificité des débats selon les époques. Majorité, gouvernement, politique en 1981 et 1988, problèmes, emploi, en 1995, entreprise, femme en 2007, milliard, euros, nucléaire en 2012. La mise en évidence des mots spécifiques (sur représentés) de chaque période nous rappelle sans surprise le contexte de chacun de ces débats. Certains mots communs tels que premier, mais surtout responsabilité, européen débat… font partie des mots utilisés de manière équivalente quelque soit la période.

La classification hiérarchique ascendante effectuée sur l’ensemble des débats met en évidence la répartition des interventions dans des classes différentes. L’examen des termes spécifiques à chaque classe permet de distinguer ainsi 5 types de discours ou thématiques :

  • Le thème de la Gestion, qui renvoie aux actions d’un gouvernement qui gère.
  • Le thème de la Politique, qui renvoie aux notions de majorité, vote, gouvernement, président de la république.
  • Le thème de la volonté et du Promouvoir, vouloir, permettre, donner, projet, responsabilité.
  • Le thème de la Décision, problème, falloir, risque, autorité.
  • Et enfin le thème du Financier avec milliard, millions, nombres, payer, euros…
Cliquez sur l'image pour agrandir

Ces thèmes, synthétisés ici dans des nuages de mots, représentent des poids inégaux selon les débats. L’analyse permet de caractériser leur poids selon les périodes ou les candidats. Le thème du financier a un poids plus significatif en 2012, en raison du contexte de crise, de même que celui de la décision autour de la problématique du nucléaire, thème d’actualité.

Enfin, les références sémantiques sont d’importance inégale et projettent sur ces débats un éclairage intéressant. Par exemple, les interventions évoquant les concepts Activité économique, Vie sociale, Ordre et Mesure sont beaucoup plus nombreuses que celles qui évoquent le Droit, la Volonté ou l’être humain !

Le graphique ci-dessous démontre en effet la place croissante au cours du temps du discours gestionnaire par rapport au discours politique, en soulignant l’opposition entre les débateurs :

  • Ceux qui accordent de l’importance au thème du Politique, Mitterrand et Giscard du début de période.
  • Ceux qui se positionnent plus sur le Décider, Gérer, Sarkozy et Royale.

Conclusion

 Cette enquête permet de montrer combien le vocabulaire employé, les thématiques abordées et le ton emprunté sont révélateurs de la nature des discours portés par ces hommes politiques, mais également du contexte dans lequel ils ont été proclamés. L'analyse lexicale, sémantique et statistique menée ici illustre bien la richesse potentielle de l'analyse des corpus textuels.

>>> Plus d'informations sur www.lesphinx.eu

L’analyse de contenu : comment construire un rapport riche, précis et pertinent

Vous hésitez sur la manière d’aborder vos analyses de données textuelles ? Certaines méthodes invitent à sélectionner des citations ou des extraits de verbatim, ou à dénombrer les mots utilisés en mobilisant les ressources de la statistique lexicale. Une méthode rigoureuse et riche est l’analyse de contenu. Elle consiste à prendre connaissance de tout le corpus pour repérer ce qui a été dit, à le noter, et à rendre compte de manière quantitative des idées clés ou des thèmes qui y sont développés.

Pour cela, la première étape consiste à élaborer une « grille thématique », décrivant les faits, idées, opinions... que l’on s’attend à trouver, et à concevoir un « code book », sorte de questionnaire sur le texte servant à noter la présence des thèmes dans la réponse ou le fragment de texte considéré. Le travail d’analyse consiste ensuite à lire le texte en isolant les passages significatifs pour l’étude et en notant les thèmes qu’ils contiennent. Enfin, il s’agira de s’intéresser à la fréquence des thèmes et à la manière dont ils sont utilisés.

Elaboration de la grille thématique

La grille thématique permet d’établir la liste des contenus, faits, idées et opinions présents dans le texte, mais elle doit également rendre compte des connaissances de l’analyste sur ce qu’il s’attend à trouver dans le texte et les théories qui peuvent s’y appliquer.

Une bonne grille thématique est autant le reflet de ce qui est lu dans le texte que de ce qui est anticipé. Il ne s’agit pas de procéder uniquement à partir du texte en essayant de synthétiser et d’organiser ses contenus, mais aussi de partir de références externes au texte qui permettront peut-être de constater que telle idée est absente. Elle s’élabore ainsi progressivement de manière inductive (à partir du texte) et déductive (à partir des connaissances à priori) et peut se construire autour des 5 grands thèmes suivants :

  • Les objets
  • Les acteurs
  • Les actions
  • Les idées
  • La tonalité

Prenons comme exemple une étude sur le loto, thème qui se place dans un cadre économique. Nous cherchons à répertorier la nature de l’utilisation des gains, en définissant 3 catégories : jouissance, investissement,  et don.

Pour établir la grille thématique, nous distinguerions par exemple :

  • Pour les objets : biens de consommation, biens d’équipement, services, argent, éléments de la nature, personnes, éléments de la société.
  • Pour les actions : Jouir, Consommer, Epargner, Investir, Donner...
  • Pour les acteurs : des personnes liées à celui qui s'exprime tels que conjoint, parents, enfants, famille, amis, entourage, ou plus généralement les gens, l’humanité...

La difficulté consiste à trouver la bonne granularité dans l’énumération des éléments qui composent chaque thème : dans l’exemple ci-dessus il serait possible de différencier "jouir" et "consommer", "épargner" et "investir", ou de détailler davantage les différents objets… Mais en voulant ainsi rendre compte des particularités du texte, le risque est de perdre en clarté au moment des analyses.

Découpage du texte et identification des passages significatifs

Comme pour une lecture de texte, qui procéderait en soulignant des passages et en les annotant, il s’agit d’isoler des phrases, paragraphes ou extraits sélectionnés pour l’unité de leur contenu. Les réponses aux questions ouvertes dans les questionnaires ont en général cette unité.

Il n’en va pas de même pour les interviews non directives dans lesquelles le repérage des unités de sens s’effectue à la lecture, en sélectionnant les passages significatifs contenant au moins un élément de la grille thématique. Le découpage dépend du contenu et conditionne l’analyse statistique qui interviendra ensuite. Ainsi 2 interviews non directives peuvent conduire selon leur richesse à identifier un nombre plus ou moins grand de passages significatifs. D’un point de vue statistique, ils auront donc des poids différents dans la restitution d’une synthèse des thèmes. Bien identifier les passages significatifs est ainsi aussi important que de bien les interpréter en référence à la grille des thèmes.

La codification

Elle consiste à associer à chaque passage les éléments de la grille qu’il contient. La manière la plus simple est d’utiliser un « code book », formulaire qui permettra de cocher les thèmes présents dans le passage. Ce travail n’est pas toujours facile, dans la mesure où une connaissance précise du domaine est nécessaire, pour comprendre et interpréter correctement ce qui est dit ou écrit. Il est important également que les éléments de la grille aient été précisément définis afin de limiter les variations d’interprétation propres à la subjectivité du codeur.

Il est donc indispensable d’expliciter la grille et de former les codeurs. Ceux-ci ont pour règle de se limiter au sens strict et d’éviter toute surinterprétation en prêtant des intensions ou en tirant des conséquences non explicitement formulées dans le texte.

La pratique du double codage permet de repérer les divergences éventuelles et ainsi de garantir une meilleure objectivement.

Enfin il peut être intéressant de prévoir dans le code book la possibilité de recopier les passages les plus remarquables qui pourront ainsi être facilement retrouvés pour agrémenter le compte rendu.

Le compte rendu

Lorsque le travail de codification est terminé, la distribution statistique des éléments du code book s’effectue par les moyens classiques de l’analyse statistique :

  • Tris à plat pour repérer l’importance relative des différents éléments de la grille.
  •  Tris croisés pour mettre en évidence la manière dont les thèmes s’articulent les uns aux autres ou dépendent des caractéristiques identitaires des interviewés.

Ces mesures procurent plus d’objectivité à l’analyse et permettent de mener des investigations beaucoup plus approfondies et rigoureuses que les impressions dégagées par une simple lecture du texte.

 Bibliographie

  • « L'analyse de contenu », Laurence Bardin, 2007, Ed Puf.
  • « L'Analyse de Contenu - de la Theorie a la Pratique », M.-F. Grinschpoun, 20011
  • « L'analyse de contenu : De la théorie à la pratique, la méthode Morin-Chartier », Christian Leray et Lise Chartier, 2009, Presse de l’Université du Québec.
  • « L'analyse de contenu », Annick Bouillaguet et André-D Robert, 1998, Ed Que sais-je.

>>> Plus d'informations sur www.lesphinx.eu

Les enquêtes en ligne pour reconsidérer l’opposition entre quali et quanti


Alors que la distinction entre les études dîtes « quali » et « quanti » est communément admise, Le Sphinx a toujours voulu démontrer, à travers ses solutions logicielles et ses prestations d’études, l’intérêt de combiner judicieusement le quali et le quanti. Cette démarche s’inscrit dans la lignée des recherches et publications de Daniel Bô, fondateur de l’institut QualiQuanti, qui mettent en évidence le caractère artificiel de cette opposition, notamment à travers le développement des enquêtes web.

Daniel Bô, PDG de l'institut QualiQuanti, HEC, utilisateur des études en ligne depuis 1998 et créateur du panel TestConso.fr en 2000, a mené plus de 800 études en ligne et a observé les pratiques en Europe comme aux Etats-Unis. Il en conclue que le débat concernant les études par Internet s’est beaucoup focalisé sur la question de la représentativité des échantillons, occultant partiellement un sujet-clé : le changement des conditions d’interrogation des interviewés.

L’auteur démontre alors que les enquêtes en ligne invitent à reconsidérer l’opposition entre quali et quanti, en proposant de regarder le sujet d’étude comme un « terrain à forer ». Le schéma ci-dessous, tiré de son livre blanc « Pour des études marketing vivantes », résume de manière simple son raisonnement. Avec le quali, on va très en profondeur dans l’analyse, mais en se limitant sur la taille de l’échantillon. Avec le quanti, on sonde des grandes populations, mais en restant plus en surface.

Le problème soulevé dans ses recherches est que les méthodes se sont construites comme des spécialités distinctes voire étanches, alors que la réalité à étudier est unique et indissociable.

Cette incompatibilité quali/quanti résulte d’une époque où l’informatique n’existait pas et où le traitement des verbatims était « manuel ». Aujourd’hui, l’informatique permet de traiter des masses de textes importantes et l’Internet facilite le recueil de données qualitatives à grande échelle. La lourdeur de recueil et de traitement des données ne constituent plus un obstacle. Il est ainsi prouvé qu’il n’est plus nécessaire de choisir entre la « force du nombre » et la « richesse de l’analyse » : on peut bénéficier des deux en même temps.

Aujourd'hui, il devient possible de faire du quali à grande échelle et du quanti en profondeur. Le tableau suivant, tiré du « Book des études online » de Daniel Bô, fournit quelques illustrations de ces techniques en plein essor. Les focus groupes en ligne sont des réunions de groupes animées sur Internet par le biais de logiciels de chat spécialisés (salons virtuels). Le « Bulletin Board », qui se traduit littéralement  par « bulletin d’information » ou « panneau d’affichage » consiste à établir un affichage progressif des réactions des consommateurs, en organisant de véritables discussions de groupe, à l’occasion desquelles les participants peuvent interagir.

Bulletin board = forum modéré

Focus Groupe Online = chat modéré

Asynchrone : les répondants répondent au moment où ils le souhaitent. Synchrone : l’animateur donne RV à une heure précise.
Durée : 3 à 15 jours. Durée : 1 heure 30.
25 questions par jour. 40 à 50 questions.
15 à 30 participants. 7 à 8 participants.
Combine différents modes d’interaction : interview individuel, discussions collectives, etc. Fonctionne comme un groupe virtuel où les consommateurs échangent leurs opinions par écrit.
Tous les jours, le modérateur lance de nouvelles séries de questions, qui tiennent compte des nouvelles expériences des interviewés et des réponses de la veille. L’étude se déroule dans un temps limité, où les participants répondent aux questions et réagissent aux stimuli et aux réponses des autres participants.
Réponses de plusieurs paragraphes. Réponses plus brèves de 2 à 3 lignes.

On remarque notamment que le temps alloué dans un « Bulletin Board » permet aux répondants de réfléchir et exposer leurs expériences et ressentis de manière plus détaillée que lors d’un Focus Groupe Online où les minutes sont comptées. Cette durée supplémentaire permet d’obtenir des analyses plus riches en précision et en qualité. Le second avantage repose dans la méthodologie : les participants répondent en effet quand ils le souhaitent, ce qui est un atout non négligeable pour les études visant le BtoB, les cadres et plus généralement les personnes très actives.

Sources :

  • Daniel Bô, « Pour des études marketing vivantes » (Dernière édition : octobre 2010)
  • Daniel Bô, « Book des études online » (Dernière édition : mai 2012)

>>> Plus d'informations sur www.lesphinx.eu

« Citez trois adjectifs » : une technique simple et productive pour générer un verbatim intéressant

Vos analyses qualitatives vous donnent du fil à retordre ? Vos résultats manquent de clarté ? Vous pouvez y appliquer la rigueur des techniques quantitatives classiques.

Afin de récolter un corpus plus homogène et plus facilement exploitable, nous vous proposons d’avoir recours à la méthode des "3 adjectifs".

AdjectifsTV

Cliquez sur l'image pour agrandir

Dans une enquête portant sur la perception des différentes chaînes de télévision française, une question ouverte est insérée : « Donnez 3 adjectifs pour qualifier la chaîne xxx ».

Une analyse lexicale simple avec quelques regroupements manuels permet d’aboutir rapidement à une vision synthétique. Suite à une analyse des co-occurrences, via l’analyse factorielle des correspondances, les perceptions des différentes chaînes apparaissent clairement :

  • Canal + : drôle, sportive, moderne...
  • M6 : jeune, musicale, dynamique...
  • Arte et France 5 : objective, intelligente, éducative etc.

En résumé : la méthode des trois adjectifs est une technique d'analyse simple, rapide, et productive.

>>> Plus d'informations sur www.lesphinx.eu