fr
Chapitre d'actes
Accès libre
Français

Le rôle des métriques d'évaluation dans le processus de recherche en TAL

Contributeurs/tricesPopescu-Belis, Andréi
Date de publication2007
Résumé

Le traitement automatique des langues (TAL) relève à la fois de la démarche scientifique et de la démarche technologique. Dans les deux cas, l'évaluation des systèmes informatiques implémentés est indispensable pour estimer le succès d'une recherche. S'inspirant du cadre ISO pour l'évaluation des logiciels, et utilisant une typologie des systèmes de TAL fondée sur la place de la langue parmi les données d'entrée ou de sortie, cet article analyse le rôle central des métriques d'évaluation à plusieurs étapes du processus de recherche en TAL. L'accent est mis sur les métriques qui comparent un résultat produit avec des résultats corrects attendus. L'analyse de plusieurs situations d'évaluation, en particulier le cas des systèmes de traduction automatique, illustre l'importance d'un choix cohérent des métriques et de l'utilisation conjointe de plusieurs métriques. L'influence du contexte d'utilisation sur le choix des métriques et le cas des systèmes interactifs sont discutés en conclusion. Research in natural language processing (NLP) has both scientific and technological dimensions. In both cases, it is necessary to evaluate the implemented systems in order to assess the success of a study. This article, grounded in the ISO framework for software evaluation, introduces a typology of NLP systems based on the role of language as input or output data, in order to analyze the central role of evaluation metrics at several stages of the NLP research process. The article focuses on the evaluation metrics that compare the response of a system to a set of correct responses. The analysis of several evaluation examples, in particular the case of machine translation systems, shows the importance of a coherent choice of metrics and of the joint use of several metrics. The influence of the context of use on the set of metrics and the case of interactive systems are discussed as a conclusion.

Mots-clés
  • Systèmes de TAL
  • Evaluation
  • Normes ISO
  • Caractéristiques de qualité
  • Métriques d'évaluation
  • NLP systems
  • Evaluation
  • ISO standards
  • Quality characteristics
  • Evaluation metrics
Citation (format ISO)
POPESCU-BELIS, Andréi. Le rôle des métriques d’évaluation dans le processus de recherche en TAL. In: TAL (Traitement Automatique de la Langue), vol. 48, n. 1. [s.l.] : [s.n.], 2007. p. 67–91.
Fichiers principaux (1)
Proceedings chapter
accessLevelPublic
Identifiants
  • PID : unige:3486
1132vues
316téléchargements

Informations techniques

Création02/10/2009 09:31:18
Première validation02/10/2009 09:31:18
Heure de mise à jour14/03/2023 15:14:59
Changement de statut14/03/2023 15:14:59
Dernière indexation12/02/2024 18:13:47
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack