Morphèmes, morphologieLes informations associées à une unité lexicale
Nous aurons parfois tendance à assimiler la notion d'unité lexicale à celle de "mot", dont il est tout de même difficile de se passer (même si c'est clairement un abus de langage). On associe traditionnellement à chaque unité lexicale présente dans un énoncé un ensemble de propriétés, que nous passons maintenant en revue. Tout d'abord, on peut associer à chaque unité lexicale une forme lemmatisée : c'est la forme sous laquelle on va trouver cette unité dans un dictionnaire de la langue courante. Elle correspond à un choix arbitraire parmi les flexions possibles que peut subir l'unité en question. En français, la forme lemmatisée (ou lemme) des noms et des adjectifs est celle du masculin singulier, tandis que celle des verbes est l'infinitif. Les autres unités sont invariables et se confondent donc avec leur lemme. On ne parle pas en général de forme lemmatisée pour les entités nommées (mais elles sont souvent aussi invariables). Nous avons déjà incidemment évoqué le fait que les unités appartiennent à des catégories grammaticales : certaines sont des noms communs, d'autres des verbes ou des adverbes, etc. Les anglos-saxons parlent d'étiquettes "part-of-speech" (ou POS). D'où provient cette classification et quel critère permet de ranger dans la même catégorie des unités distinctes ? Ce n'est pas pour rien que ces catégories sont qualifiées de "grammaticales". La notion de syntaxe et de grammaire ne sera abordée que dans le chapitre suivant, mais on peut d'ors et déjà voir son influence au niveau lexical. Plus précisément, le critère décisif qui nous est ici utile est celui de grammaticalité (nous y reviendrons au cf. chapitre 5, section 1.1). Depuis Chomsky, une grammaire est vue comme un dispositif capable de trier les suites de mots d'une langue donnée en "grammaticales" ou "non grammaticales", et cela indépendamment de leur sens. Cette capacité à formuler des jugements de grammaticalité est ce qui constitue la compétence d'un locuteur. Si on admet l'existence d'une telle capacité, alors on dira que deux unités lexicales appartiennent à la même catégorie si on peut remplacer l'une par l'autre dans n'importe quel énoncé, sans modifier sa grammaticalité. Ainsi, par exemple : les mots "livre" et "rhinocéros" appartiennent à la même catégorie parce que "le livre est sur l'étagère" et "le rhinocéros est sur l'étagère" (par exemple) sont tous les deux des énoncés grammaticaux. "livre" et "regarder" (à quelque forme conjuguée que ce soit) n'appartiennent pas à la même catégorie parce que "le regarde est sur l'étagère" n'est pas grammatical. Ce critère rappelle celui employé pour définir la notion de phonème (cf. chapitre 3, section 1.2). On peut dire aussi que les catégories grammaticales sont des classes d'équivalence pour la relation de substituabilité en préservant la grammaticalité de l'unité de niveau supérieur (l'énoncé). Il est intéressant de noter que, pour caractériser les propriétés d'un certain niveau d'analyse, on doive systématiquement faire appel au niveau d'analyse supérieur. Décidément, il est bien difficile de les isoler les uns des autres. En réalité, il ne faut pas utiliser ce critère de façon trop rigoureuse pour caractériser les classes. Si on le suivait de trop près, on ne pourrait associer de catégorie aux morphèmes grammaticaux : il faudrait en effet définir autant de catégories différentes qu'il existe de prépositions ou de conjonctions, parce qu'elles sont rarement substituables les unes aux autres (on ne peut impunément remplacer "à" par "pour" ni "qui" par "dont"). Le critère fonctionne nettement mieux pour les morphèmes lexicaux que pour les morphèmes grammaticaux, sur lesquels, précisément, repose en grande partie la structure grammaticale des énoncés qui les contiennent. Par ailleurs, les accords en genre et en nombre imposés par la langue française font que, pour préserver la grammaticalité d'un énoncé, un nom commun féminin singulier ne peut être en général remplacé que par un autre nom commun féminin singulier. Les informations flexionnelles sont pourtant généralement abstraites de la définition d'une catégorie, ce qui autorise à ranger les noms masculins et féminins dans la même classe. De même, la catéorie des "verbes" n'est pas homogène puisqu'il faudrait distinguer : les verbes intransitifs comme "dormir", qui caractérisent un individu sujet unique (on dit aussi qu'ils ne "réclament pas de complément d'objet", mais on n'a pas encore vraiment défini ces termes) les verbes transitifs comme "aimer" qui caractérisent une relation entre deux individus : un sujet et un objet les verbes bitransitifs comme "donner" qui caractérisent une relation à trois : un sujet et deux objets (quelqu'un donne quelque chose à quelqu'un d'autre). Les substitutions entre verbes ne peuvent préserver la grammaticalité qu'en tenant compte de ces propriétés. Mais ces distinctions ne sont pas toujours faites et on se contente souvent d'une unique classe "verbe". En fait, il n'y a pas consensus quant au nombre de classes à considérer, ni quant à leurs frontières précises. Remarquons aussi que de nombreux mots appartiennent à plusieurs classes distinctes. Parfois, ce sont plutôt des homonymes, c'est-à-dire des mots différents qui se trouvent avoir la même forme : les instances de "ferme" qui sont respectivement un nom commun, un verbe et un adjectif n'entretiennent pas de rapports entre eux. Mais il y a un lien très fort au contraire entre les mots "petit", "juste", "informatique"... employés comme noms communs ou comme adjectifs, de même qu'entre les usages de "fort," "clair"... en tant qu'adjectifs ou en tant qu'adverbes. L'attribution de ces mots à une classe plutôt qu'à une autre (la nature de "l'étiquette part-of-speech" qui leur est associée) dépend de l'énoncé dont ils font partie. Enfin, on associe traditionnellement aux unités lexicales présentes dans un énoncé des informations de flexion : le genre, le nombre et éventuellement le cas (qui permet de distinguer les pronoms "le" et "lui") pour les noms, les pronoms et les adjectifs ; la personne, le nombre, le temps, le mode ("indicatif", "subjonctif", etc.) et la voix ("active" ou "passive") pour les verbes.
|