lundi 26 juillet 2010

Dual boot Windows NT/2k/XP/Vista/Seven et Linux

Comment conserver le menu de démarrage de Windows, pour pouvoir démarrer Windows (jusqu'à sa version 7) et Linux?
J'ai déjà écrit un billet sur le sujet, mais la méthode décrite ne fonctionne plus depuis Windows Vista. Il existe cependant maintenant un logiciel magique pour ça : EasyBCD.

lundi 17 mai 2010

Gestion des utilisateurs en ligne de commande

La gestion des utilisateurs sous la dernière version d'Ubuntu ne fonctionne pas correctement (10.04 LTS), notamment en ce qui concerne la gestion de l'uid. Voici donc quelques commandes pour s'en sortir dans un terminal.
  • Afficher l'uid et le gid d'un utilisateur :
    > id utilisateur
  • Ajouter un groupe :
    > groupadd -gGID nom_groupe
  • Ajouter un utilisateur :
    > useradd -uUID -gGID -s/bin/bash -d/home/utilisateur -pxxx -m utilisateur
  • Changer l'uid d'un utilisateur :
    > usermod -u UID utilisateur
  • Changer le gid d'un utilisateur :
    > usermod -g GID utilisateur
  • Changer le mot de passe d'un utilisateur :
    > passwd utilisateur

samedi 8 mai 2010

Paquets indispensables sous Ubuntu

Voici une liste de quelques paquets que je trouve indispensables pour le bon fonctionnement de mon système sous Ubuntu.
  • non-free-codecs et libdvdcss2 : lire les formats audio et vidéo non libres (mp3, wmv, dcd...)
  • numlockx : activer automatiquement la touche Verr Num du pavé numérique au démarrage (cf. http://doc.ubuntu-fr.org/numlockx)
    Ajouter dans /etc/gdm/Init/Default avec les droits d'administration les lignes suivantes :
    if [ -x /usr/bin/numlockx ]; then
    exec /usr/bin/numlockx on
    fi

  • nfs-common : pour les montages NFS
  • ia32-libs et util-linux : utiliser des programmes 32 bits sous Ubuntu 64 bits
  • flashplugin64-installer : Flash Version 64 bits
    > sudo add-apt-repository ppa:sevenmachines/flash
    > sudo apt-get update
    > sudo apt-get install flashplugin64-installer
Pour générer votre fichier source.list (liste des dépôts) : https://dev.sourceslist.org

vendredi 7 mai 2010

Message "Aucun fichier ou dossier de ce type" lors de la tentative d'exécution d'un programme

J'ai été confronté au message "Aucun fichier ou dossier de ce type", ou encore sa version anglaise "No such file or directory" lors de la tentative d'exécution d'une application sous Ubuntu 10.04 (The Lucid Lynx) 64 bits sur des exécutables qui existaient pourtant bel et bien ! En fait, le message d'erreur est extrêmement maladroit car le problème n'était pas que le fichier ou le dossier n'existait pas mais que l'exécutable était une version pour un système 32 bits et non pas 64 bits...
La meilleure solution est de recompiler l'application en 64 bits ou de trouver une version 64 bits. Sinon, il reste possible d'utiliser des programmes 32 bits sous Ubuntu 64 bits en installant les paquets ia32-libs et util-linux.

dimanche 13 décembre 2009

Thunderbird sur un disque externe ou une clef usb

Je travaille régulièrement sur plusieurs ordinateurs (3 PC de bureau et 1 portable). Le plus efficace pour cette configuration est de stocker toutes ses données sur un disques externe (disque pour lequel il faut mettre en place une politique de sauvegarde régulière et automatique, un peu comme décrit dans ce billet). Dans cette configuration, comment utiliser Thunderbird sans être tributaire de la version installée en local ? Il suffit de placer Thunderbird sur le disque portable. La procedure est décrite ci-dessous.
  1. Télecharger Mozilla Thunderbird et decompresser le fichier dans le répertoire de son choix (thunderbird pour la suite du billet) sur le disque externe
  2. Sur le même disque, copier le répertoire qui contient les mails (thunderbird_mail pour la suite du billet). Il s'agit du répertoire qui contient, entre autres, les dossiers Mail et ImapMail ainsi que le fichier pref.js. Dans le cas d'une première utilisation de Thunderbird, ce répertoire peut être vide.
  3. Vous pouvez maintenant exécuter Thunderbird depuis le disque externe en tapant la commande suivante dans un terminal :
    > /home/.../thunderbird/thunderbird -profile /home/.../thunderbird_mail/
  4. Avec gnome, vous pouvez ajouter un Lanceur d'application personnalisé à votre tableau de bord. Choisir Application pour le Type et dans la zone d'édition Commande saisir :
    /home/.../thunderbird/thunderbird -profile /home/.../thunderbird_mail/
  5. Enfin, pour pouvoir envoyer un mail par un simple click dans une page Internet, il faut configurer le gestionnaire de mail par défaut. Sous Ubuntu, aller dans Système>Préférences>Applications préférées. Dans la liste de choix Logiciel de messagerie, choisir Personnalisé. Enfin, dans la zone d'édition Commande saisir :
    /home/.../thunderbird/thunderbird -profile /home/.../thunderbird_mail/ "%s"
Cette procédure fonctionne très bien avec Thunderbird 3.0 et ses versions antérieures. Curieusement, l'option -profile n'est pas documentée (thunderbird -help). Ne pas oublier "%s" à l'étape 5 !

lundi 7 décembre 2009

TreeTagger pour l'étiquetage morpho-syntaxique et la lemmatisation

L'étiquetage morpho-syntaxique d'un texte (Part-of-Speech tagging ou POS tagging en anglais), est souvent l'une des premières étapes en traitement automatique des langues (TAL). Il consiste à identifier pour chaque mot sa classe morpho-syntaxique (catégorie grammaticale, genre, nombre, temps...) à partir de son contexte. La lemmatisation désigne l'analyse lexicale consistant à retrouver la forme canonique d'un mot fléchie appelée le lemme.
TreeTagger permet d'effectuer les opérations décrites ci-dessus et peut également être utilisé comme un « chunker » pour identifier des parties du discours et délimiter des groupes syntaxiques.

Installation de TreeTagger
La procédure est décrite sur le site de TreeTagger. Pour l'installer sous Linux pour l'anglais et le français, il suffit de :

dimanche 22 novembre 2009

Livre : UML 2 - de l'apprentissage à la pratique

Enseignant à l'institut universitaire de technologie de l'Université de Paris 13, lorsque le cours d'UML m'a été confié, j'ai dû rechercher dans la volumineuse bibliographie UML un support de cours adéquat. Les ouvrages pédagogiques concernant le langage UML sont nombreux et de qualité très inégale, mais je n'ai pas eu à chercher bien loin puisque mon collègue et ami Aomar Osmani avait coécrit un support de cours d'une grande qualité (UML2, Charroux, Osmani et Thierry-Mieg, 2005). Cependant, cet ouvrage ne me convenait pas parfaitement. Il ne couvrait pas l'ensemble de la matière que je voulais enseigner et ne répondait pas à toutes mes interrogations. C'est pourquoi j'ai entrepris la rédaction de ce support, qui, de révision en révision est est devenu cet ouvrage édité dans la collection Info+ des éditions Ellipses sous le titre UML 2 - de l'apprentissage à la pratique.
L'objectif de ce livre est d'offrir une approche progressive, rigoureuse et pédagogique du langage de modélisation UML, et d'aborder des problématiques connexes comme celle des patrons de conception (design patterns en anglais) et des processus de développement logiciel mettant en œuvre le langage UML. Cet ouvrage propose également une analyse critique et pointue de certains choix de modélisation. Vous trouverez enfin dans ce livre une série de travaux dirigés accompagnés de corrigés complets et détaillés, élaborés pour permettre un apprentissage progressif et méthodologique des principales notions du langage UML.
Ce livre de 298 pages est composé de 10 chapitres décrits ci-dessous.
  1. Introduction à la modélisation objet – Ce chapitre introductif aborde la problématique du génie logiciel et de la modélisation, les différents cycles de vie d'un logiciel, les différences qui opposent la programmation structurée à l'approche orientée objet, puis les concepts fondamentaux de la pensée objet avant de présenter brièvement le langage de modélisation UML et ses différents diagrammes.
  2. Diagramme de cas d'utilisation et notions transversales d'UML – Ce chapitre commence par aborder des notions transversales du langage UML, avant de détailler les éléments constitutifs d'un diagramme de cas d'utilisation. Ces diagrammes permettent la modélisation des besoins des utilisateurs. La dernière section propose des conseils concernant leur élaboration.
  3. Diagramme de classes – Le diagramme de classes est considéré comme le plus important de la modélisation orientée objet. Ce chapitre présente, dans un premier temps, les notions fondamentales qui régissent les diagrammes de classes, puis détaille les classes et les relations, avant d'aborder les interfaces. Le chapitre traite ensuite de la problématique des diagrammes d'objets avant d'aborder l'implémentation d'un diagramme de classes, et plus précisément sa traduction en Java ou en SQL.
  4. Langage de contraintes OCL – L'objectif de ce chapitre est de permettre la spécification de contraintes sur des éléments de modèle. Ce chapitre présente tout d'abord comment les contraintes s'expriment en UML, puis détaille le langage OCL (Object Constraint Language en anglais) qui permet d'exprimer des contraintes complexes dans les diagrammes UML en général, mais plus particulièrement dans les diagrammes de classes.
  5. Diagramme d'états-transitions – Un diagramme d'états-transitions permet de spécifier de manière exhaustive et non ambigüe, à l'aide d'un automate à états finis, l'ensemble des comportements d'une instance d'un classeur. Cette modélisation est utilisée pour représenter et mettre en forme la dynamique du système.
  6. Diagramme d'activités – Un diagramme d'activités permet de mettre l'accent sur les traitements et est particulièrement adapté à la modélisation du cheminement de flots de contrôle et de flots de données.
  7. Diagramme de structures composites et diagrammes d'interaction – Les diagrammes d'interaction permettent d'établir un lien entre les diagrammes de cas d'utilisation et les diagrammes de classes en montrant comment les objets collaborent pour réaliser une certaine fonctionnalité. Le diagramme de structures composites permet de modéliser le contexte particulier d'exécution dont les diagrammes d'interaction cherchent à modéliser la dynamique.
  8. Diagrammes de composants et diagrammes de déploiement – Ces diagrammes, qui constituent les deux derniers types de vues statiques en UML, permettent respectivement de décrire le système modélisé sous forme de composants réutilisables en mettant en évidence leurs relations de dépendance, et d'identifier les éléments matériels et leur disposition physique.
  9. Patrons de conception (Design Patterns) – Un patron de conception est une solution de conception commune à des problèmes récurrents dans un contexte donné. Les patrons de conception sont désormais inévitables dès qu'il est question de technologie orientée objet. L'objectif de ce chapitre est de montrer leut intérêt à travers la présentation de quelques patrons incontournables (5 patrons GRASP, 6 patrons du GoF puis 4 autre patrons incontournables).
  10. Mise en œuvre d'UML – UML n'est qu'un langage de modélisation, ce n'est pas une méthode. La première section de ce chapitre est justement consacrée à la présentation des principales méthodes issues des meilleures pratiques de l'ingénierie logicielle : le Processus Unifié (UP, RUP), Scrum et XP. Les sections suivantes détaillent une méthode simple et générique, située à mi-chemin entre UP et XP.
Cet ouvrage est naturellement destiné aux étudiants en informatique qui suivent un cursus comportant du génie logiciel, de la modélisation UML ou de la programmation objet, aux professeurs désirant s'appuyer sur un support de cours précis et complet, ou encore aux professionnels informaticiens utilisant UML dans leurs projets.

YaTeA : un extracteur de candidats terme

Un terme est une structure linguistique (un mot ou un groupe de mots) qui dénote un concept. YaTeA (Yet Another Term ExtrActor) permet d'identifier dans un corpus des groupes nominaux qui peuvent correspondre à des termes (c.-à-d. des candidats de terme). Cet outil a été développé par Thierry Hamon et Sophie Aubin au LIPN dans le cadre du projet ALVIS. YaTeA peut également prendre en entrée une ressource terminologique externe.

Installation de YaTeA (en étant root) :
  • Configurer le module CPAN / Invoquer le shell :
    > perl -MCPAN -we 'shell'
  • Installer les modules dont YaTeA dépend (quit pour quitter le shell CPAN)
    cpan> install YAML
    cpan> install Config::General
    cpan> install Parse::Yapp
    cpan> install Module::Build
    cpan> quit
  • Télécharger Lingua-YaTeA-0.5.tar.gz :
    http://search.cpan.org/~thhamon/Lingua-YaTeA-0.5/
  • Le décompresser
    > tar -xvzf Lingua-YaTeA-0.5.tar.gz
  • Installer YaTeA
    > perl Makefile.PL

    > make
    > make test

    > make install
  • Vérifier que l'installation à bien copié les répertoires etc/yatea/, share/doc/ et share/YaTeA. Sinon, c'est à vous de le faire :
    > cp -r etc/yatea /usr/local/etc/.
    > cp -r share/doc /usr/local/share/.
    > cp -r share/YaTeA /usr/local/share/.
Utilisation de YaTeA

YaTeA prend en entrée un corpus tabulaire produit par TreeTagger. Pour exécuter YaTeA, il suffit de taper la commande suivante :
> yatea -rcfile yatea.rc corpus.ttg
yatea.rc est le fichier de paramétrage du traitement. Un exemple se trouve dans /usr/local/etc/yatea/yatea.rc. En fonction de votre installation, ce fichier doit contenir les lignes suivantes :
CONFIG_DIR = /usr/local/share/YaTeA/config
LOCALE_DIR = /usr/local/share/YaTeA/locale

language = EN

Si le corpus est en français plutôt qu'en anglais, il suffit de remplacer EN par FR.
YaTeA créer un répertoire portant le même nom que le corpus spécifié pour y stocker les résultats du traitement.

Nouvelles du cours d'UML 2

Ce billet est l'alter ego de celui déjà publié concernant le cours de Bases de Données et langage SQL. Le cours d'UML hébergé chez Developpez.com se porte très bien. Depuis sa mise en ligne en janvier 2007, il totalise plus 1 085 000 pages consultées au jour de l'écriture de ce billet. Le flux moyen sur 2009 est de 1500 pages par jour. Cet intérêt m'a donné la motivation nécessaire pour continuer mon effort afin d'améliorer significativement ce support de cours. Cette nouvelle version est éditée ce mois-ci dans la collection Info+ des éditions Ellipses. J'en parlerai prochainement dans un nouveau billet.
Je tiens à remercier les éditions Ellipses pour m'avoir autorisé à conserver la première ébauche en ligne sur le site Developpez.com.
Voici ce que la version publié apporte par rapport à la version en ligne chez Developpez.com :
  • De nombreuses améliorations (corrections, illustrations, exemples...). En fait, seulement 20% de la version éditée se retrouve à l'identique dans la version en ligne.
  • De nouvelles notions (Design Patterns, introduction aux principales méthodes de développement, diagramme de structures composites...). La version éditée est pratiquement 2 fois plus volumineuse que la version en ligne (en nombre de phrases et en nombre de figures).
  • Des séances de travaux dirigés et de travaux pratiques accompagnées de corrigés complets et détaillés.
  • Une présentation bien plus agréable sous la forme d'un vrai livre.

jeudi 8 octobre 2009

Manipuler des pdf

Voici trois manières utiles de manipuler des fichiers pdf. La première permet de fusionner des pdf. La seconde de concevoir un nouveau pdf composé, entre autres, d'autres pdf. La dernière permet enfin de convertir chacune des pages d'un pdf en image.
  • Fusionner des pdf :
    pdftk fichier1.pdf fichier2.pdf output resultat.pdf
  • Extraire une page (la 15 dans l'exemple) d'un fichier pdf :
    pdftk A=source.pdf cat A15 output destination.pdf
  • Extraire plusieurs pages (de la 2 à la 5 dans l'exemple) d'un fichier pdf :
    pdftk A=source.pdf cat A2-5 output destination.pdf
  • Chiffrer un document pdf et retirer tous les droits :
    pdftk source.pdf output destination.pdf owner_pw motDePasse
  • Rotation de 180° de l'ensemble des pages d'un pdf :
    pdftk source.pdf cat 1-endS output destination.pdf
  • Concevoir un nouveau pdf à partir d'autres pdf :
    Créer un fichier LaTeX et inclure les pdf avec la commande \includepdf (\usepackage{pdfpages}) permet de réaliser un nouveau pdf à partir de nombreux pdf, tout en autorisant une grande souplesse de paramétrage (ex : réaliser les actes d'une conférence à partir des fichiers pdf des articles).
  • Réduire la taille d' un pdf :
    gs -q -dSAFER -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook -sOUTPUTFILE=destination.pdf -f source.pdf
    Remarque : /screen pour un document destiné à l’écran ; /ebook pour une qualité entre screen et printer ; /printer pour un document destiné à l’impression ; /prepress pour un document destiné à l’impression professionnelle
  • Transformer un pdf en jpeg compressées :
    convert -density 130x130 -quality 10 source.pdf image.jpg
    Remarque : cette compression dégrade fortement le résultat, augmenter la densité et la qualité (comprise entre 0 pour la compression la plus forte et 100 pour la qualité la meilleure) pour améliorer le résultat
  • Division ou assemblage de documents PDF sans utiliser la ligne de commande :
    Utiliser PDF Split and Merge en installant le paquet pdfsam.