collatinus, lemmatiseur/analyseur morphologique du latin
étiquetages en catégories :
CST's POS tagger (anglais)
ucrel.lancs.ac.uk/claws/trial.html (anglais)
un autre étiqueteur (anglais)
un autre en couleur (anglais)
un autre avec d'autres couleurs (anglais)
repérage des entités nommées :
entités nommées (anglais)
Parmi les programmes libres et gratuits qui illustrent les notions introduites dans ce chapitre, on peut citer Unitex, logiciel fondé sur les automates et les RTRs (cf. chapitre suivant). Quand on charge un texte avec Unitex, ce dernier lui applique un certain nombre de pré-traitements (normalisations, comptages, lemmatisations, etc.) qui, tous, sont réalisés à l'aide d'automates facilement visualisables et modifiables. L'utilisateur peut aussi écrire ses propres automates pour, par exemple, effectuer la recherche d'une expression régulière dans un texte :
www-igm.univ-mlv.fr/~unitex/