fr
Article scientifique
Accès libre
Français

Qualité d'ajustement d'arbres d'induction

Date de publication2004
Résumé

Cet article discute des possibilités de mesurer la qualité de l'ajustement d'arbres d'induction aux données comme cela se fait classiquement pour les modèles statistiques. Nous montrons comment adapter aux arbres d'induction les statistiques du khi-2, notamment celle du rapport de vraisemblance utilisée dans le cadre de la modélisation de tables de contingence. Cette statistique permet de tester l'ajustement du modèle, mais aussi l'amélioration de l'ajustement qu'apporte la complexification de l'arbre. Nous en déduisons également des formes adaptées des critères d'information AIC et BIC qui permettent de sélectionner le meilleur arbre en termes de compromis entre ajustement et complexité. Nous illustrons la mise en oeuvre pratique des statistiques et indicateurs proposés avec un exemple réel. - This paper is concerned with the fit of induction trees. Namely, we explore the possibility to measure the goodness-of-fit as it is classically done in statistical modeling. We show how Chi-square statistics and especially the Log-likelihood Ratio statistic that is abundantly used in the modeling of contingency tables can be adapted for induction trees. Not only is the Log-likelihood Ratio statistic suited for testing the fit. It allows us also to test the significance of the fit improvement provided by the complexification of a tree. In addition, we derive from it adapted forms of the Akaike (AIC) and Bayesian (BIC) information criteria that prove useful in selecting the best compromise tree between fit and complexity. The practical use of the statistics and indicators proposed is illustrated on an real example.

Mots-clés
  • Arbre d'induction
  • Qualité d'ajustement
  • Tests du khi-2
  • Comparaison d'arbres
Citation (format ISO)
RITSCHARD, Gilbert, ZIGHED, Djamel A. Qualité d’ajustement d’arbres d’induction. In: Revue des nouvelles technologies de l’information RNTI, 2004, vol. E-1, p. 45–67.
Fichiers principaux (1)
Article (Published version)
accessLevelPublic
Identifiants
  • PID : unige:4154
503vues
595téléchargements

Informations techniques

Création30/11/2009 15:06:00
Première validation30/11/2009 15:06:00
Heure de mise à jour14/03/2023 15:17:49
Changement de statut14/03/2023 15:17:49
Dernière indexation15/01/2024 19:13:54
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack