Approche sémantique de l'affixation dans la perspective du TAL
Details
Serval ID
serval:BIB_75AD83138F37
Type
PhD thesis: a PhD thesis.
Collection
Publications
Institution
Title
Approche sémantique de l'affixation dans la perspective du TAL
Director(s)
Jolivet R.
Institution details
Université de Lausanne, Faculté des lettres
Address
Faculté des lettres Université de Lausanne UNIL - Dorigny Anthropole - bureau 2049 CH-1015 Lausanne Anthropole - bureau 2049
Publication state
Accepted
Issued date
2014
Language
french
Number of pages
236
Abstract
Cette recherche pluridisciplinaire se situe dans le domaine de la linguistique mais a une orientation computationnelle. Son objectif est de proposer un cadre conceptuel de la formalisation du processus de l'affixation. Les questions qui sont traitées dans ce travail sont : Est-ce qu'il serait possible d'automatiser le processus de dérivation par affixation ? Lors de la dérivation, comment sélectionne-t-on un affïxe particulier parmi toutes les possibilités ? Comment arrive-t-on à dégager le sens d'un dérivé qu'on n'a jamais entendu ou même celui d'un néologisme ?
Le travail a parcouru les étapes suivantes : l'analyse linguistique, voire sémantique du processus de l'affixation a été suivie de la formalisation mathématique, qui a conduit au traitement automatique des formalismes proposés dans le but de construire un système prototypique afin de fournir la preuve de leur validité.
L'analyse sémantique des données comprenait l'extraction du sens des affixes (préfixes et suffixes français) dans les dérivés provenant d'un corpus informatisé (Lexique 3,5). La prochaine étape comprenait la catégorisation sémantique des affixes en fonction de leur sens dans un classement hiérarchique à deux niveaux.
Cette catégorisation a aidé à établir les représentations formelles (vectorielles et matricielles) des affixes et des bases. Ces formalismes ont permis de construire deux systèmes prototypiques : le système d'analyse sémantique des dérivés et le système de synthèse des dérivés.
Le présent travail présente comme perspective d'avenir les possibilités dans les domaines touchés. L'analyse approfondie des affixes pourrait aider à raffinement des catégorisations et des formalismes. Les systèmes proposés ici feront partie d'un écosystème plus large de systèmes d'analyse et de génération des langues naturelles, à l'aide des systèmes auxiliaires qui les complémentent.
Le travail a parcouru les étapes suivantes : l'analyse linguistique, voire sémantique du processus de l'affixation a été suivie de la formalisation mathématique, qui a conduit au traitement automatique des formalismes proposés dans le but de construire un système prototypique afin de fournir la preuve de leur validité.
L'analyse sémantique des données comprenait l'extraction du sens des affixes (préfixes et suffixes français) dans les dérivés provenant d'un corpus informatisé (Lexique 3,5). La prochaine étape comprenait la catégorisation sémantique des affixes en fonction de leur sens dans un classement hiérarchique à deux niveaux.
Cette catégorisation a aidé à établir les représentations formelles (vectorielles et matricielles) des affixes et des bases. Ces formalismes ont permis de construire deux systèmes prototypiques : le système d'analyse sémantique des dérivés et le système de synthèse des dérivés.
Le présent travail présente comme perspective d'avenir les possibilités dans les domaines touchés. L'analyse approfondie des affixes pourrait aider à raffinement des catégorisations et des formalismes. Les systèmes proposés ici feront partie d'un écosystème plus large de systèmes d'analyse et de génération des langues naturelles, à l'aide des systèmes auxiliaires qui les complémentent.
Create date
08/04/2014 10:59
Last modification date
30/10/2020 8:33