UNIGE document Doctoral Thesis
previous document  unige:96989  next document
add to browser collection
Title

Computational models of learning the idiosyncrasy of multiword expressions

Author
Directors
Defense Thèse de doctorat : Univ. Genève, 2017 - Sc. 5103 - 2017/07/17
Abstract Idiosyncrasy is an important property of the language that enables it to be productive and at the same time prevents it from growing infinitely large. Idiosyncrasymeans having a peculiar statistical, semantic or syntactic behavior. Idiosyncratic phrases are commonly referred to as Multiword Expressions (MWEs) and have application in most natural language processing (NLP) tasks. The ability to identify and generate MWEs is essential for an NLP system designed to interact in and understand human language. Presently,most models of identifying idiosyncrasy suffer from a low precision. In order to improve the quality of MWE-related systems, more formal definitions of idiosyncrasy as well as more complex computational models need to be developed. This work attempts to define idiosyncrasy on statistical and distributional grounds and study it froma computational perspective. It also presents various models for identifying different types ofMWEs with a focus on nominal MWEs.
Abstract L'idiosyncrasie est une propriété importante de la langue, qui lui permet d'être productive tout en l'empêchant de grandir infiniment. Cela signifie avoir un comportement statistique, sémantique ou syntaxique particulier. Les phrases quimontrent ce comportement particulier sont communément appelées Les expressions polylexicales (MWEs) et ont une application dans la plupart des tâches de traitement automatique des langues (TAL). La capacité à identifier et générer des MWEs est essentielle pour un système de TAL conçu pour comprendre et interagir dans le langage humain. À l'heure actuelle, la plupart des modèles d'identification de l'idiosyncrasie ne sont pas suffisants et souffrent principalement d'une faible précision. Afin d'améliorer la qualité des systèmes liés au MWEs, des définitions plus formelles de l'idiosyncrasie ainsi que desmodèles informatiques plus complexes doivent être développés. Ce travail tente de définir l'idiosyncrasie sur des bases statistiques et de distribution, et de l'étudier dans une perspective de calcul. Il fournit également différents modèles pour identifier différents types deMWEs.
Identifiers
URN: urn:nbn:ch:unige-969896
Full text
Thesis (1.9 MB) - public document Free access
Structures
Citation
(ISO format)
FARAHMAND, Meghdad. Computational models of learning the idiosyncrasy of multiword expressions. Université de Genève. Thèse, 2017. https://archive-ouverte.unige.ch/unige:96989

221 hits

121 downloads

Update

Deposited on : 2017-09-25

Export document
Format :
Citation style :