UNIGE document Maîtrise d'études avancées
previous document  unige:16525  next document
add to browser collection
Title

Vers une exploitation des liens morphologiques multilingues

Author
Director
Denomination Traitement informatique multilingue
Defense Maîtrise d'études avancées : Univ. Genève, 2003
Abstract Le traitement du lexique constitue un défi important pour le traitement automatique de la langue. De nombreuses approches ont été étudiées pour formaliser et organiser les informations contenues dans le lexique. Un des défis du traitement du lexique est l'expression des régularités morphologiques. En effet, si certains préfèrent une approche énumérative (consistant en l'énumération de toutes les formes de tous les mots) d'autres ont tenté d'adopter une approche polymorphique. Dans ce type d'approche, on essaie de généraliser au maximum les informations morphologiques pour obtenir un module de traitement du lexique moins volumineux et plus puissant. Tout l'enjeu d'une telle approche est d'étudier l'expression des régularités pour en généraliser au maximum le contenu. Dans ce mémoire, nous étudions la possibilité d'exploiter d'autres généralités : les liens morphologiques multilingues. Des langues historiquement proches possèdent en effet de nombreux points communs, dans leur morphologie comme dans leur syntaxe et dans leur sémantique. La construction d'un lexique prenant en compte ces similitudes offre de nombreux avantages. Entre autre choses, des avantages techniques quant à la robustesse et à la taille de ce genre de lexique (en comparaison avec des lexiques monolingues pris séparément) (Polylex). Ainsi il existe une similitude intuitive entre les mots « liberté » en français et « libertà » en italien. Une telle similitude implique également qu'un locuteur francophone qui n'a que très peu de connaissance en italien pourra néanmoins déduire que le mot équivalent pour le français « fraternité » sera sans doute « fraternità ». Cette recherche se fondera principalement sur le projet Polylex, qui poursuit ces recherches avec les langues germaniques. De notre coté, nous explorerons les langues latines. Tout comme dans le projet Polylex, nous choisirons la technique des lexiques d'héritage. Un lexique d'héritage est une architecture permettant de traiter différents types d'informations lexicales dans une même structure, et proposant un niveau de généralisation intéressant permettant une grande robustesse et une grande flexibilité (Polylex). Ce type d'architecture permet d'exploiter au maximum les généralisations possibles au sein du lexique et de partager plus facilement les informations qui sont communes à plusieurs entrées d'un lexique. Donc, plus les informations s'appliquent à un grand nombre de mots, plus elles seront placées haut dans la hiérarchie. Dans un lexique multilingue, nous chercherons à appliquer à plusieurs langues cette même rationalité.
Keywords Traitement informatique des languesMorphologieLexiqueItalienFrançais
Stable URL https://archive-ouverte.unige.ch/unige:16525
Full text
Master (661 Kb) - public document Free access
Structures
Research group TIM/ISSCO

238 hits

223 downloads

Update

Deposited on : 2011-06-30

Export document
Format :
Citation style :