dimanche 22 novembre 2009

YaTeA : un extracteur de candidats terme

Un terme est une structure linguistique (un mot ou un groupe de mots) qui dénote un concept. YaTeA (Yet Another Term ExtrActor) permet d'identifier dans un corpus des groupes nominaux qui peuvent correspondre à des termes (c.-à-d. des candidats de terme). Cet outil a été développé par Thierry Hamon et Sophie Aubin au LIPN dans le cadre du projet ALVIS. YaTeA peut également prendre en entrée une ressource terminologique externe.

Installation de YaTeA (en étant root) :
  • Configurer le module CPAN / Invoquer le shell :
    > perl -MCPAN -we 'shell'
  • Installer les modules dont YaTeA dépend (quit pour quitter le shell CPAN)
    cpan> install YAML
    cpan> install Config::General
    cpan> install Parse::Yapp
    cpan> install Module::Build
    cpan> quit
  • Télécharger Lingua-YaTeA-0.5.tar.gz :
    http://search.cpan.org/~thhamon/Lingua-YaTeA-0.5/
  • Le décompresser
    > tar -xvzf Lingua-YaTeA-0.5.tar.gz
  • Installer YaTeA
    > perl Makefile.PL

    > make
    > make test

    > make install
  • Vérifier que l'installation à bien copié les répertoires etc/yatea/, share/doc/ et share/YaTeA. Sinon, c'est à vous de le faire :
    > cp -r etc/yatea /usr/local/etc/.
    > cp -r share/doc /usr/local/share/.
    > cp -r share/YaTeA /usr/local/share/.
Utilisation de YaTeA

YaTeA prend en entrée un corpus tabulaire produit par TreeTagger. Pour exécuter YaTeA, il suffit de taper la commande suivante :
> yatea -rcfile yatea.rc corpus.ttg
yatea.rc est le fichier de paramétrage du traitement. Un exemple se trouve dans /usr/local/etc/yatea/yatea.rc. En fonction de votre installation, ce fichier doit contenir les lignes suivantes :
CONFIG_DIR = /usr/local/share/YaTeA/config
LOCALE_DIR = /usr/local/share/YaTeA/locale

language = EN

Si le corpus est en français plutôt qu'en anglais, il suffit de remplacer EN par FR.
YaTeA créer un répertoire portant le même nom que le corpus spécifié pour y stocker les résultats du traitement.

2 commentaires:

Anonyme a dit…

hi, good work I am intrested in your application so if you can send me an other version for windows
paipo.java@gmail.com

Laurent Audibert a dit…

I'm not the author of this NLP tool. The authors are Thierry Hamon and Sophie Aubin and YaTeA is downloadable on CPAN (http://search.cpan.org/~thhamon/Lingua-YaTeA-0.5/).