Slide da Clasfa su sintesi numerica delle distribuzioni statistiche. Il Pdf esplora i concetti di media aritmetica, ponderata e geometrica, con definizioni, proprietà ed esempi pratici, ideale per lo studio universitario della Matematica.
Mostra di più18 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
La sintesi numerica di una distribuzione statistica è basata sulla costruzione di particolari indici numerici che delineano alcuni aspetti essenziali della distribuzione in esame. Questi indici consentono un confronto tra le caratteristiche di distribuzioni diverse.
Possiamo individuare tre famiglie principali di indici:
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 1
I valori medi sono strumenti di sintesi che descrivono l'ordine di grandezza del carattere nell'insieme delle unità osservate.
Nella famiglia delle medie si distinguono:
(mediana e quantili: caratteri espressi almeno in scala ordinale) (moda: tutti i caratteri) Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 3
Alla sintesi numerica si chiede di evidenziare gli aspetti principali di una distribuzione, tenendo conto che tutte le volte che si sintetizzano più dati con un solo valore, si perdono delle informazioni. L'obiettivo dei metodi che vedremo è quella di rendere obiettiva questa sintesi.
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 2
Quali proprietà deve soddisfare una quantità C per essere un valor medio?
Definizione 1 - Criterio di internatlità (Cauchy) X min SCS. max
Definizione 2 - Criterio di invarianza (Chisini) Il valor medio mantiene invariato il risultato di una certa funzione f f(x1,x2, ... ,x ;... ,x)= f(C,C, ... ,C, ... ,C)
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 4
La media aritmetica di un insieme di n valori x1, ... ,x, di un carattere quantitativo X è pari alla somma dei valori divisa per la loro numerosità ossia risulta dalla equiripartizione dell'ammontare complessivo del carattere fra le unità osservate. Pertanto, la media aritmetica di n osservazioni è:
x= M(X) = x1 + x 2 + . . . + x, II i=1 n 5
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano
La media aritmetica è uno strumento di sintesi adatto in due situazioni fondamentali:
Esempio 1 Bilancio dell'UE (anno 1996): capitoli di spesa
Capitoli di spesa milioni di € Agricoltura 40564 Ricerca 3380 Azioni strutturali 26197 Altre politiche interne 2536 Azione esterne 5070 Amministrazione 4225 Fondo di sviluppo 2536 Totale 84508
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 7
La media aritmetica soddisfa entrambe i criteri che abbiamo introdotto:
1) x SXSX max infatti, se consideriamo la prima disuguaglianza, si ha che 2 volte X min = min + ... + Xmin n < x1+x2+ ... +x, n 2) f = _ x, i=1 infatti Ex ;= Ex=nx i=1
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 6
Volendo calcolare una misura della dimensione media dei capitoli di spesa è naturale pensare a quel valore che se fosse assegnato a tutti i capitoli di spesa non altererebbe la dimensione totale del bilancio. Ossia alla media altimetrica:
(40564 + 3380 + 26197+2536+5070+4225+2536) x = 7 x=12072.6
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 8
Esempio 2 - Velocità della luce Misurazioni di Paul Newcombe (1879) sulla velocità della luce.
28 25 28 28 25 28 24 36 24 19 26 23 27 21 28 29 23 16 30 34 32 26 28 29 29 29 25 25 32 39 24 32 29 26 25 27 22 27 40 22 36 33 26 16 37 27 21 32 36 28 20 32 31 33 30 31 24 27 -2 36 27 26 24 30 23
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 9
11
Le misurazioni rappresentano 65 tentativi (con errore) di misurare uno stesso fenomeno, il tempo impiegato dalla luce (in millesimi di secondo) a percorrere la distanza di 7400 metri. La media aritmetica è quell'indice di posizione coerente con l'ipotesi di errori non sistematici (ossia che sommano a 0)
x=12x =1714 = 27.29 n =1 1774
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 10
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 12
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 13
Calcolo della media aritmetica:
89404 ==- 2x = 89404 = 4470.2 n i=1
Calcoliamo ora la produzione media per regione di frumento distintamente per Nord, Centro, Sud e Isole.
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 15
Consideriamo il seguente data set relativo alla Produzione di Frumento (in Quintalix1000 nelle Regioni italiane nel 1992 (Fonte: ISTAT):
Regione Prod. Frumento Regione Prod. Frumento Piemonte 6838 Marche 8430 Valle d'Aosta 0 Lazio 4416 Lombardia 3748 Abruzzo 3799 Trentino A.A. 5 Molise 3056 Veneto 3942 Campania 2593 Friuli V.G. 335 Puglia 8813 Liguria 30 Basilicata 3379 Emilia Romagna 16818 Calabria 1136 Toscana 6153 Sicilia 9268 Umbria 5069 Sardegna 1576
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 14
Regioni Nord Prod. Frumento Piemonte 6838 Valle d'Aosta 0 Lombardia 3748 Trentino A.A. 5 Veneto 3942 Friuli V.G. 335 Liguria 30 Emilia Romagna 16818 Somma 31716 18 1 8 x 31716 8 i=1 176 - 3964.
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 16
Regioni Centro Prod. Frumento Toscana 6153 Umbria 5069 Marche 8430 Lazio 4416 Abruzzo 3799 Molise 3056 Somma 30923 50 απο = 1 Σχ, i=1 II 30923 6 =5153.8
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 17
Non è infrequente che insiemi di dati contengano una piccola frazione di osservazioni (al limite una sola osservazione) "anomale" nel senso che assumono valori lontani (ad es. molto più grandi) da quelli assunti dalla maggior parte delle osservazioni. In simili circostanze la media aritmetica assumerà un valore che è ancora un punto di equilibrio per la somma delle modalità, ma non è più un valore equamente rappresentativo di tutte le osservazioni. In altre parole, la media aritmetica può essere molto sensibile alla presenza di osservazioni anomale.
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 19
Analogamente per il Sud e le isole avremo che:
26765 X andtake =12x; = 26765 = 4460.8 i=1
E' facile verificare che la media pesata delle medie coincide con la media calcolata sul collettivo di tutte le regioni:
3965.5×8+5154.8×6+4461.8×6 = 4470.2 20
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 18
La media di una trasformazione non lineare dei dati non è in generale uguale alla stessa trasformazione applicata ai dati. Si consideri ad esempio la trasformazione non lineare consistente nel prendere il quadrato delle modalità assunte da una variabile X, ovvero y =x} i =1, ... ,n. Allora
n =1 1 i=1
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 20
Se le n osservazioni sono classificate in distribuzione di frequenza secondo le K modalità puntuali di un carattere discreto, la media aritmetica è:
₹=,M(X)= n x,M1 +x2M2 + ... +xnk == 5 xnk. n k=1
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano
Se l'ammontare Ax è noto per ogni classe, si considera la somma sulle classi dell'ammontare
₹= ,M(X) =- LA n k=1
Quando la variabile X è divisa in intervalli non è possibile calcolare l'ammontare effettivo del carattere, ma si può cercare di approssimarlo assumendo che tutte le unità della k-esima classe abbiano la medesima modalità &,:
x=1M(X) =- Exm2. 1 k=1
La modalità x generalmente è posta pari al valore centrale dell'intervallo per classi chiuse, mentre per classi aperte è necessario scegliere un valore che sintetizzi la distribuzione del carattere su quell'intervallo.
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 22
Riconsideriamo l'esempio dei dati sulle precipitazioni annue a Nevada City e la distribuzione dei dati ottenuta raggruppando le osservazioni in 12 classi di ampiezza costante 10.
Rainfall 0-|10 0 Per calcolare la media aritmetica 10-|20 1 20-130 5 30-140 21 40-150 21 50-160 27 Possiamo ipotizzare che le 60-170 16 70-180 13 80-190 1 90-|100 0 100-|110 1 110-|120 0 Somma 106 dobbiamo sostituire all'intervallo di valori che definisce una classe, un valore singolo. osservazioni si distribuiscano in modo uniforme nell'intervallo della classe e scegliere il punto medio come "rappresentativo" della classe.
24
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano
Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 23
21