en
Proceedings chapter
Open access
English

Bi dimensional partitioning with limited loss of information

Published inSocieta Italiana di Statistica, p. 319-328
Presented at Milan, 2002
Publication date2002
Abstract

L'aggregazione delle righe e colonne di una tabella a doppia entrata ha un costo in termini di informazione perduta. Con riferimento all'informazione che una variabile fornisce rispetto all'altra, viene affrontato il problema dell'aggregazione con l'obiettivo di massimizzare una misura d'associazione tra la variabile di riga e quella di colonna (ad es. gli indici t di Tschuprow, t di Goodman e Kruskal, tb di Kendall). Viene presentata una procedura euristica introdotta da Ritschard e Nikoloyannis (2000), della quale viene discussa la complessità e l'attendibilità. Tale euristica riduce drasticamente la complessit`a propria della procedura esaustiva consistente nel vaglio di tutti i possibili gruppi. L'attendibilità viene valutata mediante una serie di studi di simulazione. I risultati mostrano che la riduzione di complessità ha un costo relativamente alto in termini di percentuale di ottimi mancanti. Tuttavia si evidenzia che le soluzioni mancate sono molto vicine agli altri ottimi globali.

Keywords
  • Optimal Crosstable Reduction
  • Association
  • Bi Dimensional Categorization
Citation (ISO format)
ZIGHED, Djamel A., RITSCHARD, Gilbert, ERRAY, Walid. Bi dimensional partitioning with limited loss of information. In: Societa Italiana di Statistica. Milan. [s.l.] : [s.n.], 2002. p. 319–328.
Main files (1)
Proceedings chapter
accessLevelPublic
Identifiers
  • PID : unige:4558
417views
497downloads

Technical informations

Creation2009.12.01. 오후 3:28:21
First validation2009.12.01. 오후 3:28:21
Update time2023.03.14. 오후 3:19:13
Status update2023.03.14. 오후 3:19:13
Last indexation2024.02.12. 오후 6:17:41
All rights reserved by Archive ouverte UNIGE and the University of GenevaunigeBlack