UNIGE document Book Chapter
previous document  unige:4526  next document
add to browser collection
Title

Arbre BIC optimal et taux d'erreur

Author
Published in Extraction des connaissances : Etat et perspectives. Toulouse: Cépaduès. 2006, p. 403-408
Collection Revue des Nouvelles Technologies de l'Information; E-5
Abstract Nous reconsidérons dans cet article le critère BIC pour arbres d'induction proposé dans Ritschard et Zighed (2003, 2004) et discutons deux aspects liés à sa portée. Le premier concerne les possibilités de le calculer. Nous montrons comment il s'obtient à partir des statistiques du rapport vraisemblance utilisées pour tester l'indépendance ligne-colonne de tables de contingence. Le second point porte sur son intérêt dans une optique de classification. Nous illustrons sur l'exemple du Titanic la relation entre le BIC et le taux d'erreur en généralisation lorsqu'on regarde leur évolution selon la complexité de l'arbre. Nous esquissons un plan d'expérimentation en vue de vérifier la conjecture selon laquelle le BIC minimum assurerait en moyenne le meilleur taux d'erreur en généralisation.
Abstract We discuss two aspects related to the scope of the BIC index for induction trees proposed in Ritschard et Zighed (2003, 2004). The first point is about how to compute it. We show that the BIC can easily be derived from the Likelihood Ratio Chi-square statistics used for testing the row-column independence of contingency tables. The second aspect is related to its interest for classification purposes. We illustrate, by means of the Titanic example, the expected link between the BIC and the generalization error rate in terms of their evolution with respect to the tree complexity. Finally, we sketch an experiment design for checking empirically the conjecture that the minimal BIC ensures on average the best generalization error rate.
Note Il s'agit d'une version concentrée d'une contribution présentée à l'Atelier qualité des données et connaissances DKQ05, Conférence EGC, Paris 2005.
Full text
Proceedings chapter - public document Free access
Book extract - public document Free access
Structures
Citation
(ISO format)
RITSCHARD, Gilbert. Arbre BIC optimal et taux d'erreur. In: Extraction des connaissances : Etat et perspectives. Toulouse : Cépaduès, 2006. p. 403-408. (Revue des Nouvelles Technologies de l'Information; E-5) https://archive-ouverte.unige.ch/unige:4526

239 hits

1153 downloads

Update

Deposited on : 2009-12-01

Export document
Format :
Citation style :