Morphèmes, morphologie



Yüklə 83,85 Kb.
səhifə8/8
tarix25.12.2023
ölçüsü83,85 Kb.
#197119
1   2   3   4   5   6   7   8
BEGOYIM MUSTAQIL ISHI

2.4

Sites Web et programmes gratuits





De nombreux sites réalisent en ligne des traitements se situant au niveau des mots ou des morphèmes.

  • comptages, statistiques (à partir de textes):

    • Google N-Gram viewer (multilingue)

    • www.lexique.org

    • Frantext, une base de textes français interrogeable en ligne

  • décompositions morphologiques :

    • www.cis.hut.fi/cgi-bin/morpho/nform.cgi (anglais)

    • www.xrce.xerox.com/competencies/content-analysis/demos/french (français)

    • collatinus, lemmatiseur/analyseur morphologique du latin

  • étiquetages en catégories :

    • CST's POS tagger (anglais)

    • ucrel.lancs.ac.uk/claws/trial.html (anglais)

    • un autre étiqueteur (anglais)

    • un autre en couleur (anglais)

    • un autre avec d'autres couleurs (anglais)

  • repérage des entités nommées :

    • entités nommées (anglais)

Parmi les programmes libres et gratuits qui illustrent les notions introduites dans ce chapitre, on peut citer Unitex, logiciel fondé sur les automates et les RTRs (cf. chapitre suivant). Quand on charge un texte avec Unitex, ce dernier lui applique un certain nombre de pré-traitements (normalisations, comptages, lemmatisations, etc.) qui, tous, sont réalisés à l'aide d'automates facilement visualisables et modifiables. L'utilisateur peut aussi écrire ses propres automates pour, par exemple, effectuer la recherche d'une expression régulière dans un texte :
www-igm.univ-mlv.fr/~unitex/



Yüklə 83,85 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin