Classification sémantique des lexies fondée sur le paraphrasage

Remarques préliminaires sur la classification des lexies

Yüklə 1,24 Mb.

Pdf görüntüsü

səhifə	2/12
tarix	02.06.2023
ölçüsü	1,24 Mb.
	#122333

1 2 3 4 5 6 7 8 9 ... 12

1. Remarques préliminaires sur la classification des lexies
Pourquoi classer les lexies ? Tout d’abord, parce qu’elles forment un ensemble
bien trop vaste pour être véritablement appréhendé dans sa totalité. Classer les
lexies, c’est en partie donner un sens au lexique lui-même en mettant de l’ordre dans
un désordre apparent. Confrontés au gigantisme du lexique, il est normal que nous
cherchions à le rationaliser, et que nous procédions comme nous avons appris à le
faire depuis notre plus tendre enfance : nous classons pour connaître et reconnaître.
Et le lexique n’est pas une entité qui peut se concevoir sous un angle unique. De
1
Nous sommes extrêmement reconnaissant à Igor Mel’čuk pour ses commentaires sur une
première version de cet article.
1
Polguère, Alain (2011) Classification sémantique des lexies fondée sur le paraphrasage. Cahiers de lexicologie
98, « Du lexique aux dictionnaires en passant par la grammaire. Hommages à Chai-song Hong », Seong
Heon Lee (dir.), Paris, Classiques Garnier, 197–211.

multiples systèmes de classification des lexies existent, parce que le lexique est tissé
de multiples structures : il est multidimensionnel. Rappelons quelques-uns des
systèmes de classification lexicale les plus courants, en commençant par les plus
« superficiels », pour terminer par les plus « profonds ».
Tout d’abord, les dictionnaires classent les lexies simplement pour permettre
un accès à l’information qu’ils encodent. Si le système d’écriture est alphabétique,
on classe en fonction de l’ordre canonique des lettres de l’alphabet qui composent le
signifiant écrit de la lexie ; on classe aussi par racines consonantiques dans les
dictionnaires de langues sémitiques. En l’absence d’alphabet, on classe par « clés »
de caractères ou codes numériques inférés des configurations de traits en écriture
chinoise, etc. Bref, on peut classer simplement pour ranger en fonction de critères
formels fondés sur les signifiants lexicaux.
Ensuite, on peut classer selon la logique grammaticale, en utilisant les parties
du discours. Ces classes regroupent les lexies avant tout en fonction de leurs
propriétés de combinatoire grammaticale : valence passive, combinatoire
morphologique, etc. C’est sur cette classification qu’opèrent les règles de
grammaire. Ces dernières ne font pas référence à des lexies individuelles, mais bien
à des classes (verbe, nom commun, adjectif qualificatif, etc.), les comportements
réguliers qu’elles énoncent s’appliquant alors à n’importe quelle lexie pour peu
qu’elle appartienne à la classe en question.
On peut finalement effectuer une classification sémantique des lexies. En effet,
il est important de rappeler que la classification par parties du discours n’est
aucunement sémantique et que les propriétés sémantiques partagées par toutes les
lexies d’une partie du discours donnée sont tellement peu spécifiques qu’elles n’ont
guère de pertinence en regard des propriétés grammaticales. Bien entendu, tous les
verbes sont des prédicats sémantiques. Mais cela vaut aussi pour tous les adjectifs,
tous les adverbes et une bonne partie des noms. Certains noms peuvent être des
quasi-prédicats – sens liants dénotant des entités, comme ‘ami’, ‘voisin’,
‘extrémité’… – ou être des noms sémantiques – sens non liants dénotant des entités,
comme ‘caillou’, ‘colline’… –, mais puisque les prédicats nominaux existent, cela
n’est aucunement une propriété définitoire des noms
2
. Pour classifier
sémantiquement les lexies, il faut créer des systèmes véritablement fondés sur le
contenu exprimé par les lexies, totalement ou en grande partie autonome de leurs
propriétés grammaticales. Deux types de classements sont alors utilisés.
Premièrement, on peut avoir recours à un classement aristotélicien, ou
ontologique. C’est un classement qui structure le lexique de façon hiérarchique, en
faisant appel, directement ou indirectement, à la relation d’hyperonymie. Il s’agit
d’ordonner le lexique du haut en bas : des unités les plus vagues aux unités les plus
spécifiques. Parfois, la classification est simultanément sémantique et grammaticale,
comme dans le cas de WordNet (Fellbaum 1998)
3
– qui scinde la hiérarchisation du
lexique selon les parties du discours profondes de Verbe, Nom, Adjectif et Adverbe.
Parfois, elle ignore les partitions grammaticales, comme dans le cas de la hiérarchie
des étiquettes sémantiques du français, dont il sera question ici.
2
Sur les notions de prédicat, quasi-prédicat et nom sémantiques, voir Mel’čuk et Polguère (2008).
3
http://wordnet.princeton.edu/.
2

Deuxièmement, on peut fonctionner par « champs », en s’attachant à la
présence de composantes sémantiques spécifiques dans la définition des lexies.
Ainsi, un champ sémantique S – champs sémantiques de l’alimentation, des
animaux, des sentiments, etc. – sera une classe de lexies possédant toutes un
sémantème correspondant à S en position stratégique dans leur définition, que ce
sémantème soit ou non la composante centrale de la définition en question. Plutôt
que de regrouper les lexies – unités lexicales –, on peut aussi regrouper les vocables,
c’est à dire les « mots polysémiques », selon la même logique. On construit alors des
champs lexicaux (et non des champs sémantiques) : des classes de vocables dont la
lexie de base appartient à un champ sémantique donné. Selon cette distinction, on
dira que le champ sémantique des sentiments contient, notamment, la lexie
DOULEUR
B
(‘souffrance psychique’), mais que le champ lexical des sentiments ne
contient pas le vocable
DOULEUR
, parce que la définition de la lexie de base de ce
vocable –
DOULEUR
A
(‘souffrance physique’) – ne met pas en jeu le sémantème
‘sentiment’.
C
ONVENTION
1 – Nous nous appuierons par défaut, tout au long de l’article, sur
la numérotation du Trésor de la Langue Française informatisé ou TLFi
(Dendien et Pierrel 2003)
4
.
Comme l’illustre le cas de
DOULEUR
ci-dessus, la notion de champ lexical est
opératoire dans un contexte comme celui du travail lexicographique, où l’on doit
explorer la structure polysémique des vocables avec un maximum d’homogénéité,
alors que la notion de champ sémantique a une valeur dans un contexte où prime la
prise en considération des buts communicatifs du locuteur.
Toutes ces observations visent à montrer qu’il n’y a pas et ne peut pas y avoir
un unique système de classification des lexies. De par la nature du lexique et de par
la nature de l’ensemble du système de la langue (interaction lexique-grammaire),
plusieurs classifications sont nécessaires, chacune ayant une finalité donnée. Bien
plus, ces différents systèmes de classification doivent être conçus pour interagir. On
ne peut ainsi concevoir une classification sémantique des lexies, sans se poser la
question de son interaction avec le système de classification grammaticale porté par
les parties du discours.
La suite de cet article est consacrée à un système particulier de classification
sémantique, celui des étiquettes sémantiques, qui a originellement été conçu dans le
contexte d’un travail strictement lexicographique, mais a maintenant développé des
ramifications allant bien au-delà de l’agenda initial. Nous voulons notamment
revenir sur la dernière présentation du système en question (Polguère 2003a), pour à
la fois effectuer une mise à jour de la notion elle-même et en élargir la perspective.
Nous procédons pour cela en trois étapes. Nous proposons tout d’abord, section 2,
une définition de la notion d’étiquette sémantique, après avoir introduit plusieurs
notions fondamentales de lexicologie sur lesquelles elle s’appuie. Ensuite, section 3,
nous caractérisons de façon globale le système formé par l’ensemble des étiquettes
sémantiques d’une langue comme le français. Finalement, section 4, nous
expliquons brièvement, en guise de conclusion, comment nous avons été amené à
4
Rappelons que le TLFi est consultable en ligne : http://atilf.atilf.fr/tlf.htm.
3

élaborer les étiquettes sémantiques dans le cadre d’une entreprise de nature
purement lexicographique, alors qu’il nous semble à présent qu’elles peuvent jouer
un rôle bien en dehors de ce contexte initial de développement.
Notons que la notion d’étiquette sémantique est universelle, mais que chaque
langue possède son propre système d’étiquettes sémantiques. Nos exemples seront
tous fondés sur le système des étiquettes du français, qui est, à notre connaissance, le
seul étudié avec une certaine systématicité à ce jour
5
.
Nous dédions ces modestes réflexions au Professeur Hong Chai Song, en
souvenir de deux séjours mémorables effectués grâce à lui à l’Université Nationale
de Séoul, en 2005 et 2006.

Yüklə 1,24 Mb.

Dostları ilə paylaş:

1 2 3 4 5 6 7 8 9 ... 12