Doctoral thesis
OA Policy
English

Improving statistical machine translation of informal language: a rule-based pre-editing approach for French Forums

ContributorsGerlach, Johannaorcid
Defense date2015-03-13
Abstract

La barrière linguistique limite le partage de connaissances entre communautés sur les forums internet. La traduction automatique (TA), qui permettrait d'aborder cette limitation, rencontre de nombreuses difficultés avec les textes communautaires. Cette thèse vise à investiguer dans quelle mesure un processus de préédition automatique ou interactif utilisant une technologie à base de règles peut réduire ces difficultés et ainsi améliorer la TA statistique de textes de forums français. Nous étudions différentes transformations puis évaluons leur impact sur la TA. Au-delà d'une amélioration significative de la qualité de la TA, nous observons une réduction de l'effort technique et temporel de post-édition. Au travers d'une étude de faisabilité avec de vrais utilisateurs de forums, nous observons que la tâche de préédition est envisageable dans ce contexte. Finalement, nous confirmons la portabilité du processus de préédition développé dans ce travail vers d'autres systèmes de TA et pour des forums de différents domaines.

Keywords
  • Traduction automatique
  • Préédition
  • Post-édition
  • Contenu communautaire
  • Forums
Research groups
Funding
  • European Commission - Automated Community Content Editing PorTal [288769]
Citation (ISO format)
GERLACH, Johanna. Improving statistical machine translation of informal language: a rule-based pre-editing approach for French Forums. Doctoral Thesis, 2015. doi: 10.13097/archive-ouverte/unige:73226
Main files (1)
Thesis
accessLevelPublic
Identifiers
2693views
1847downloads

Technical informations

Creation12/06/2015 16:45:00
First validation12/06/2015 16:45:00
Update time14/03/2023 23:22:43
Status update14/03/2023 23:22:43
Last indexation25/09/2025 22:06:35
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack