UNIGE document Doctoral Thesis
previous document  unige:73226  next document
add to browser collection
Title

Improving statistical machine translation of informal language: a rule-based pre-editing approach for French Forums

Author
Director
Defense Thèse de doctorat : Univ. Genève, 2015 - FTI 22 - 2015/03/13
Abstract La barrière linguistique limite le partage de connaissances entre communautés sur les forums internet. La traduction automatique (TA), qui permettrait d'aborder cette limitation, rencontre de nombreuses difficultés avec les textes communautaires. Cette thèse vise à investiguer dans quelle mesure un processus de préédition automatique ou interactif utilisant une technologie à base de règles peut réduire ces difficultés et ainsi améliorer la TA statistique de textes de forums français. Nous étudions différentes transformations puis évaluons leur impact sur la TA. Au-delà d'une amélioration significative de la qualité de la TA, nous observons une réduction de l'effort technique et temporel de post-édition. Au travers d'une étude de faisabilité avec de vrais utilisateurs de forums, nous observons que la tâche de préédition est envisageable dans ce contexte. Finalement, nous confirmons la portabilité du processus de préédition développé dans ce travail vers d'autres systèmes de TA et pour des forums de différents domaines.
Keywords Traduction automatiquePrééditionPost-éditionContenu communautaireForums
Identifiers
URN: urn:nbn:ch:unige-732262
Full text
Thesis (4.5 MB) - public document Free access
Structures
Research group TIM/ISSCO
Project FP7: ACCEPT
Citation
(ISO format)
GERLACH, Johanna. Improving statistical machine translation of informal language: a rule-based pre-editing approach for French Forums. Université de Genève. Thèse, 2015. https://archive-ouverte.unige.ch/unige:73226

1398 hits

675 downloads

Update

Deposited on : 2015-06-17

Export document
Format :
Citation style :