en
Master of advanced studies
Open access
French

Vers une exploitation des liens morphologiques multilingues

ContributorsCartoni, Bruno
Master program titleTraitement informatique multilingue
Defense date2003
Abstract

Le traitement du lexique constitue un défi important pour le traitement automatique de la langue. De nombreuses approches ont été étudiées pour formaliser et organiser les informations contenues dans le lexique. Un des défis du traitement du lexique est l'expression des régularités morphologiques. En effet, si certains préfèrent une approche énumérative (consistant en l'énumération de toutes les formes de tous les mots) d'autres ont tenté d'adopter une approche polymorphique. Dans ce type d'approche, on essaie de généraliser au maximum les informations morphologiques pour obtenir un module de traitement du lexique moins volumineux et plus puissant. Tout l'enjeu d'une telle approche est d'étudier l'expression des régularités pour en généraliser au maximum le contenu. Dans ce mémoire, nous étudions la possibilité d'exploiter d'autres généralités : les liens morphologiques multilingues. Des langues historiquement proches possèdent en effet de nombreux points communs, dans leur morphologie comme dans leur syntaxe et dans leur sémantique. La construction d'un lexique prenant en compte ces similitudes offre de nombreux avantages. Entre autre choses, des avantages techniques quant à la robustesse et à la taille de ce genre de lexique (en comparaison avec des lexiques monolingues pris séparément) (Polylex). Ainsi il existe une similitude intuitive entre les mots « liberté » en français et « libertà » en italien. Une telle similitude implique également qu'un locuteur francophone qui n'a que très peu de connaissance en italien pourra néanmoins déduire que le mot équivalent pour le français « fraternité » sera sans doute « fraternità ». Cette recherche se fondera principalement sur le projet Polylex, qui poursuit ces recherches avec les langues germaniques. De notre coté, nous explorerons les langues latines. Tout comme dans le projet Polylex, nous choisirons la technique des lexiques d'héritage. Un lexique d'héritage est une architecture permettant de traiter différents types d'informations lexicales dans une même structure, et proposant un niveau de généralisation intéressant permettant une grande robustesse et une grande flexibilité (Polylex). Ce type d'architecture permet d'exploiter au maximum les généralisations possibles au sein du lexique et de partager plus facilement les informations qui sont communes à plusieurs entrées d'un lexique. Donc, plus les informations s'appliquent à un grand nombre de mots, plus elles seront placées haut dans la hiérarchie. Dans un lexique multilingue, nous chercherons à appliquer à plusieurs langues cette même rationalité.

fre
Keywords
  • Traitement informatique des langues
  • Morphologie
  • Lexique
  • Italien
  • Français
Research group
Citation (ISO format)
CARTONI, Bruno. Vers une exploitation des liens morphologiques multilingues. 2003.
Main files (1)
Master thesis
accessLevelPublic
Identifiers
  • PID : unige:16525
620views
480downloads

Technical informations

Creation2011/06/16 16:51:00
First validation2011/06/16 16:51:00
Update time2023/03/14 16:52:36
Status update2023/03/14 16:52:36
Last indexation2024/01/29 19:12:17
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack