Conference presentation
OA Policy
French

Vers une simplification automatique de la parole en français : les enjeux de l’extraction des données d’apprentissage pour la simplification linguistique

Presented atColloque International AFLS 2023, Le français et ses frontières, Villeneuve-d'Ascq, 7-9 septembre 2023
Presentation date2023-09-08
Abstract

La Simplification Automatique de Textes (SAT) est un domaine du TAL qui vise à réduire automatiquement la complexité linguistique des textes, sans pour autant perdre leur signification originale. Bien qu’il s’agisse d’une tâche importante d’un point de vue sociétal et computationnel, automatiser la simplification linguistique est souvent contrainte par la rareté de corpus parallèles associant des phrases complexes et simples. Ceci est encore plus prégnant dans le cas du français, où les ressources existantes sont insuffisantes pour l’entraînement de modèles basés sur l’apprentissage automatique (Brouwers et al., 2012 ; Cardon & Grabar, 2019). De plus, la majorité des travaux précédents se sont penchés sur la simplification linguistique de sources écrites et peu d’études ont examiné des méthodes servant à simplifier la parole (Buet & Yvon, 2021).

Notre travail cherche à pallier ces deux lacunes de manière séquentielle. Tout d’abord, nous proposons une méthode d’exploitation de corpus permettant d’extraire automatiquement des paires de phrases pertinentes pour la SAT. Cela facilite ensuite l’entraînement de modèles de simplification phrastique et permet d’étendre par la suite la tâche de la simplification automatique à une modalité orale.

Keywords
  • Simplification automatique de la parole
  • Simplification de phrase
  • Exploitation de corpus comparables
  • Tâches sous-dotées
Citation (ISO format)
ORMAECHEA GRIJALBA, Lucía et al. Vers une simplification automatique de la parole en français : les enjeux de l’extraction des données d’apprentissage pour la simplification linguistique. In: Colloque International AFLS 2023. Villeneuve-d’Ascq. 2023.
Main files (1)
Presentation
accessLevelPublic
Secondary files (1)
Identifiers
  • PID : unige:171346
155views
43downloads

Technical informations

Creation12/09/2023 13:20:55
First validation14/09/2023 12:35:49
Update time14/09/2023 12:35:49
Status update14/09/2023 12:35:49
Last indexation01/11/2024 06:01:04
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack