Tirer parti des corpus de textes : un enjeu majeur pour enrichir des résultats

  • Titre de la communication : Sphinx Quali : un nouvel outil d’analyses textuelles et sémantiques
  • Auteurs : Younès Boughzala, Jean Moscarola, Mathilde Hervé
  • Conférence : JADT 2014 : 12es Journées internationales d’Analyse statistique des Données Textuelles, 3 - 6 juin 2014, Paris : www.aftal.fr/jadt2014/

>>> Téléchargez le papier

A travers une présentation constructive et critique, l’objectif de cette communication est de présenter le logiciel d’Analyses des Données Textuelles (ADT) : « Sphinx Quali ». C’est un outil permettant d’analyser des corpus très volumineux de diverses origines (questions ouvertes, articles scientifiques ou de presse, écrits historiques, entretiens libres ou semi-directifs, sites Web, forums, pages réseaux sociaux…), et de combiner des synthèses automatiques, des analyses de contenu et des fouilles de texte. En effet, en se référant à trois courants différents, à savoir les CAQDAS, les outils de traitement automatique des langues et les moteurs de recherche Web, ce logiciel intègre trois types d’approches de plus en plus complémentaires : lexicales, sémantiques et statistiques.

Présenté lors des 12es Journées internationales d’Analyse statistique des Données Textuelles (JADT 2014), ce papier a mis en évidence les principales innovations : l’utilisation des moteurs sémantiques (thésaurus, ontologies, analyse des sentiments), les moteurs lexicaux et statistiques (classification hiérarchique descendante, sélection de verbatim) et l’apprentissage et l’extension automatique de codification de contenu. La présentation des principales innovations s’est appui sur des exemples permettant d’apprécier la portée et les limites de ce nouveau logiciel.

 

           

>>> Plus d'informations sur www.lesphinx.eu

Share and Enjoy:
  • Print
  • Digg
  • StumbleUpon
  • del.icio.us
  • Facebook
  • Yahoo! Buzz
  • Twitter
  • Google Bookmarks

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>