Pagina 1 di 1

Pulizia dei dati

Inviato: 26 lug 2009, 00:46
da Stex19
Pare che in analisi statistica e in probabilità esista un medoto chiamato "pulizia dei dati" (anche se di preciso non so a cosa serva...).
Ho provato a cercarlo su google e su wikipedia ma non si trova niente...
Qualcuno ne ha sentito parlare e saprebbe dirmi dove posso trovare qualche informazione per capirci qualcosa??

thanks! :)

Inviato: 26 lug 2009, 01:39
da SkZ
ci sono varie teorie:
alcuno elimina quei dati che appaiono con frequenza maggiore di quella teorica, altri pesano il dato in base alla sua distanza dal punto teorico, qualcuno fa nulla

Inviato: 27 lug 2009, 18:13
da febiz2004
Quello che dici te, potrebbero essere i cosiddetti "filtri", ovvero te filtri i dati con una funzione con il fine di fare una analisi statatistica e provare test d'ipotesi. Prova a cercare filters, magari è questo quello che stavi cercando

Federico

Inviato: 12 ago 2009, 22:50
da aczél
anche "outliers", metodi per eliminare dati che inquinano una determinata serie.

Inviato: 12 ago 2009, 22:58
da aczél
o anche il metodo delle componenenti principali, che consiste nello scartare alcuni dati prendendone in considerazione solo altri, purché quelli presi in considerazione già da soli spieghino una significativa % della variabilità del fenomeno (p es. 90 %).
Ciò permette di concentrare l'attenzione su un numero limitato di variabili e quindi di semplificare i calcoli con la medesima significatività (o quasi) rispetto al considerare tutte le variabili del problema.
Ciò è particolrmente utile, ad esempio, quando alcune variabili sono difficilmente esprimibili in termini matematici.
Spero di aver capito il problema, perché il termine pulizia dei dati è abbastanza generico.

ciao
alberto