Analyser les sentiments ? Fondements d'une méthode éprouvée et créative

Dans un contexte de Big Data, où les données sont collectées dans des volumes importants et à une vitesse impressionnante, où les données sont de nature variées (données structurées, données non structurées comme les textes, les images, les sons…), le traitement et l’analyse de cette matière première devient une étape incontournable.

Pour le traitement des données textuelles, l’analyse des sentiments est un traitement automatique des langues très utile pour automatiser la synthèse des multiples avis pour obtenir efficacement une vue d'ensemble des opinions sur un sujet donné. En effet, les sources de données textuelles porteuses d'opinion disponibles sur le web se multiplient : avis d'internautes, forums, réseaux sociaux… L'intérêt de ces données est considérable, pour les annonceurs qui souhaitent obtenir un retour client sur leurs produits ou leur image de marque, leur e-réputation, mais également pour les personnes souhaitant se renseigner pour un achat, une sortie, ou un voyage.

Une expression d'opinion possède une polarité, qui peut être soit positive, soit négative, soit neutre. La valeur neutre correspond à une opinion de polarité ambiguë, qui sera éventuellement désambiguïsée par le contexte.

Une observation peut être composée de plusieurs opinions avec des intensités différentes (exemple : « le repas était divin mais le tarif du menu est excessif »). Le chargé d’études va difficilement capter ces nuances qui complexifient l’analyse d’un texte notamment lorsque la quantité de texte est très importante, d’où l’intérêt d’un traitement automatique assisté.

L’orientation de chaque observation est déterminée par agrégation des opinions qui la compose en application de certaines règles :

  • Nettement positif ou négatif : l'observation ne contient que des opinions positives ou négatives
  • Plutôt positif ou négatif : l'observation contient des opinions positives et négatives.
  • Les positives ou négatives dominent (somme des valeurs positives/négatives>1,2 somme des valeurs négatives/positives)
  • Partagé : l'observation contient des opinions positives et négatives sans que l’une des 2 ne domine
  • Sans opinion : l'observation ne contient aucune opinion positive ou négative

L’analyseur de sentiment détermine dans l’ensemble du corpus les opinions exprimant un sentiment, un jugement ou une évaluation. Il précise la tonalité du texte en situant la nature et l'intensité des opinions émises par rapport à un répertoire de sentiments :

- Types : conseil, sentiment, jugement

- Catégories : recommander, suggérer, espérer, blâmer, louer, évaluer, irritation, apaisement, étonnement, intérêt, haine, déception, peur, offense, tristesse, ennui, divertissement, émotion

Cette analyse est possible grâce au moteur Synapse qui se base sur un dictionnaire morphosyntaxique de 158 000 lemmes, un thésaurus à 4 niveaux de 3781 feuilles documentées par autant d’ontologies. Ce moteur renvoie, pour chaque texte analysé, les éléments du thésaurus qui lui correspondent.

Ci-dessous un exemple tiré de l’analyse de 1 263 commentaires déposés sur le site Trip Advisor concernant un hôtel. Le moteur d’analyse des sentiments de Synapse repose sur le repérage des opinions positives ou négatives présentes dans chacune des observations. On constate ici que la valence des réponses est majoritairement positive ; le tableau permet quant à lui de relever les mots spécifiques (surreprésentés) selon l’orientation positive ou négative.

Pour le chargé d’étude, les outils d’analyse de sentiments permettent un gain de temps considérable pour faire ressortir rapidement des opinions sur un sujet. La maitrise de l’outil par le chargé d’études est toutefois importante pour optimiser la pertinence de l’analyse et en faire ressortir.

>>> Plus d'informations sur www.lesphinx.eu

Share and Enjoy:
  • Print
  • Digg
  • StumbleUpon
  • del.icio.us
  • Facebook
  • Yahoo! Buzz
  • Twitter
  • Google Bookmarks

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>