Nel presente lavoro vengono considerati alcuni tipici problemi inferenziali che si incontrano nelle applicazioni di Data Mining. In tale contesto i dati spesso non soddiffano le usuali ipotesi statistiche che giustfiicano l'utlizzo di tecniche standard basate su modelli paametrici e test di significatività. Attraveso un ampio studio empirico si esplorano invece le potenzialità dei metodi non parametrici ed in particolare del DART, ai fini della previsione di singoli valori di una variabile oggetto di indagine e della stima della media. I risultati ottenuti documentano una notevole efficienza del DART, in termini di errore quadratico medio, anche in presenza di campioni autoselezionati, relazioni non lineari e asimmetrie nelle variabili utilizzatre.
Non-parametric methods for data-mining applications
MONTANARI, Giorgio Eduardo
2002
Abstract
Nel presente lavoro vengono considerati alcuni tipici problemi inferenziali che si incontrano nelle applicazioni di Data Mining. In tale contesto i dati spesso non soddiffano le usuali ipotesi statistiche che giustfiicano l'utlizzo di tecniche standard basate su modelli paametrici e test di significatività. Attraveso un ampio studio empirico si esplorano invece le potenzialità dei metodi non parametrici ed in particolare del DART, ai fini della previsione di singoli valori di una variabile oggetto di indagine e della stima della media. I risultati ottenuti documentano una notevole efficienza del DART, in termini di errore quadratico medio, anche in presenza di campioni autoselezionati, relazioni non lineari e asimmetrie nelle variabili utilizzatre.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.