en
Doctoral thesis
Open access
English

Improving statistical machine translation of informal language: a rule-based pre-editing approach for French Forums

ContributorsGerlach, Johannaorcid
Defense date2015-03-13
Abstract

La barrière linguistique limite le partage de connaissances entre communautés sur les forums internet. La traduction automatique (TA), qui permettrait d'aborder cette limitation, rencontre de nombreuses difficultés avec les textes communautaires. Cette thèse vise à investiguer dans quelle mesure un processus de préédition automatique ou interactif utilisant une technologie à base de règles peut réduire ces difficultés et ainsi améliorer la TA statistique de textes de forums français. Nous étudions différentes transformations puis évaluons leur impact sur la TA. Au-delà d'une amélioration significative de la qualité de la TA, nous observons une réduction de l'effort technique et temporel de post-édition. Au travers d'une étude de faisabilité avec de vrais utilisateurs de forums, nous observons que la tâche de préédition est envisageable dans ce contexte. Finalement, nous confirmons la portabilité du processus de préédition développé dans ce travail vers d'autres systèmes de TA et pour des forums de différents domaines.

fre
Keywords
  • Traduction automatique
  • Préédition
  • Post-édition
  • Contenu communautaire
  • Forums
Research group
Funding
  • European Commission - Automated Community Content Editing PorTal [288769]
Citation (ISO format)
GERLACH, Johanna. Improving statistical machine translation of informal language: a rule-based pre-editing approach for French Forums. 2015. doi: 10.13097/archive-ouverte/unige:73226
Main files (1)
Thesis
accessLevelPublic
Identifiers
2364views
1739downloads

Technical informations

Creation06/12/2015 4:45:00 PM
First validation06/12/2015 4:45:00 PM
Update time03/14/2023 11:22:43 PM
Status update03/14/2023 11:22:43 PM
Last indexation05/02/2024 4:15:29 PM
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack