Sintesi numerica delle distribuzioni statistiche con medie aritmetiche

Slide da Clasfa su sintesi numerica delle distribuzioni statistiche. Il Pdf esplora i concetti di media aritmetica, ponderata e geometrica, con definizioni, proprietà ed esempi pratici, ideale per lo studio universitario della Matematica.

Mostra di più

18 pagine

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

Sintesi numerica delle distribuzioni statistiche

La sintesi numerica di una distribuzione statistica è basata sulla costruzione di particolari indici numerici che delineano alcuni aspetti essenziali della distribuzione in esame. Questi indici consentono un confronto tra le caratteristiche di distribuzioni diverse.

Possiamo individuare tre famiglie principali di indici:

  • indici di tendenza centrale o di posizione
  • indici di variabilità o dispersione
  • indici di forma

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 1

I valori medi

I valori medi sono strumenti di sintesi che descrivono l'ordine di grandezza del carattere nell'insieme delle unità osservate.

Nella famiglia delle medie si distinguono:

  • medie analitiche calcolate con operazioni algebriche sui valori del carattere (caratteri quantitativi)
  • medie lasche (moda, mediana, quantili), determinate in base alla loro frequenza o alla posizione occupata nella graduatoria delle osservazioni individuali.

(mediana e quantili: caratteri espressi almeno in scala ordinale) (moda: tutti i caratteri) Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 3

Sintesi numerica delle distribuzioni statistiche (2)

Alla sintesi numerica si chiede di evidenziare gli aspetti principali di una distribuzione, tenendo conto che tutte le volte che si sintetizzano più dati con un solo valore, si perdono delle informazioni. L'obiettivo dei metodi che vedremo è quella di rendere obiettiva questa sintesi.

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 2

Definizioni di media

Quali proprietà deve soddisfare una quantità C per essere un valor medio?

Criterio di internatlità (Cauchy)

Definizione 1 - Criterio di internatlità (Cauchy) X min SCS. max

Criterio di invarianza (Chisini)

Definizione 2 - Criterio di invarianza (Chisini) Il valor medio mantiene invariato il risultato di una certa funzione f f(x1,x2, ... ,x ;... ,x)= f(C,C, ... ,C, ... ,C)

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 4

Media aritmetica (1)

La media aritmetica di un insieme di n valori x1, ... ,x, di un carattere quantitativo X è pari alla somma dei valori divisa per la loro numerosità ossia risulta dalla equiripartizione dell'ammontare complessivo del carattere fra le unità osservate. Pertanto, la media aritmetica di n osservazioni è:

x= M(X) = x1 + x 2 + . . . + x, II i=1 n 5

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano

Quando usare la media aritmetica? (1)

La media aritmetica è uno strumento di sintesi adatto in due situazioni fondamentali:

  1. quando le modalità del carattere possono essere pensate come la redistribuzione di un unico ammontare all'interno del collettivo

Esempio 1: Bilancio dell'UE (anno 1996)

Esempio 1 Bilancio dell'UE (anno 1996): capitoli di spesa

Capitoli di spesa milioni di € Agricoltura 40564 Ricerca 3380 Azioni strutturali 26197 Altre politiche interne 2536 Azione esterne 5070 Amministrazione 4225 Fondo di sviluppo 2536 Totale 84508

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 7

Media aritmetica (2)

La media aritmetica soddisfa entrambe i criteri che abbiamo introdotto:

1) x SXSX max infatti, se consideriamo la prima disuguaglianza, si ha che 2 volte X min = min + ... + Xmin n < x1+x2+ ... +x, n 2) f = _ x, i=1 infatti Ex ;= Ex=nx i=1

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 6

Quando usare la media aritmetica? (2)

Volendo calcolare una misura della dimensione media dei capitoli di spesa è naturale pensare a quel valore che se fosse assegnato a tutti i capitoli di spesa non altererebbe la dimensione totale del bilancio. Ossia alla media altimetrica:

(40564 + 3380 + 26197+2536+5070+4225+2536) x = 7 x=12072.6

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 8

Quando usare la media aritmetica? (3)

  1. quando i valori osservati del fenomeno possono essere pensati come approssimazioni di un unico "valore vero"

Esempio 2: Velocità della luce

Esempio 2 - Velocità della luce Misurazioni di Paul Newcombe (1879) sulla velocità della luce.

28 25 28 28 25 28 24 36 24 19 26 23 27 21 28 29 23 16 30 34 32 26 28 29 29 29 25 25 32 39 24 32 29 26 25 27 22 27 40 22 36 33 26 16 37 27 21 32 36 28 20 32 31 33 30 31 24 27 -2 36 27 26 24 30 23

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 9

Proprietà della media aritmetica (1)

  1. La somma dei valori assunti da un insieme di n unità statistiche è uguale alla media aritmetica moltiplicata per n 8 i=1
  2. La media aritmetica è il baricentro della distribuzione, ossia la somma degli scarti dalla media aritmetica è 0 (x-x)=0 i=1

11

Quando usare la media aritmetica? (4)

Le misurazioni rappresentano 65 tentativi (con errore) di misurare uno stesso fenomeno, il tempo impiegato dalla luce (in millesimi di secondo) a percorrere la distanza di 7400 metri. La media aritmetica è quell'indice di posizione coerente con l'ipotesi di errori non sistematici (ossia che sommano a 0)

x=12x =1714 = 27.29 n =1 1774

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 10

Proprietà della media aritmetica (2)

  1. Sia c un numero qualsiasi, allora E(x,-c)2=>(x-x)2+n(x-c)2 =1 i=1
  2. La somma dei quadrati degli scarti dei valori assunti da un insieme di n unità statistiche dalla loro media aritmetica è minima (x ;- c)2 =min se c=x ¿= 1 (è una conseguenza della precedente proprietà)

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 12

Proprietà della media aritmetica (3)

  1. Se un collettivo di n unità statistiche è suddiviso in L sottoinsiemi disgiunti di numerosità n1,n2, ... ,, per cui _n = n e aventi media /=1 aritmetica x1, x2, ... , x1, allora 18 n =1 xn,
  2. La media aritmetica è un'operatore lineare 1M(aX +b) = ax +b 1M(a+bX +cY )= a +bx +g

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 13

Media aritmetica - Popolazione divisa in gruppi (2)

Calcolo della media aritmetica:

89404 ==- 2x = 89404 = 4470.2 n i=1

Calcoliamo ora la produzione media per regione di frumento distintamente per Nord, Centro, Sud e Isole.

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 15

Media aritmetica - Popolazione divisa in gruppi (1)

Consideriamo il seguente data set relativo alla Produzione di Frumento (in Quintalix1000 nelle Regioni italiane nel 1992 (Fonte: ISTAT):

Regione Prod. Frumento Regione Prod. Frumento Piemonte 6838 Marche 8430 Valle d'Aosta 0 Lazio 4416 Lombardia 3748 Abruzzo 3799 Trentino A.A. 5 Molise 3056 Veneto 3942 Campania 2593 Friuli V.G. 335 Puglia 8813 Liguria 30 Basilicata 3379 Emilia Romagna 16818 Calabria 1136 Toscana 6153 Sicilia 9268 Umbria 5069 Sardegna 1576

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 14

Media aritmetica - Popolazione divisa in gruppi (3)

Regioni Nord: Produzione Frumento

Regioni Nord Prod. Frumento Piemonte 6838 Valle d'Aosta 0 Lombardia 3748 Trentino A.A. 5 Veneto 3942 Friuli V.G. 335 Liguria 30 Emilia Romagna 16818 Somma 31716 18 1 8 x 31716 8 i=1 176 - 3964.

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 16

Media aritmetica - Popolazione divisa in gruppi (4)

Regioni Centro: Produzione Frumento

Regioni Centro Prod. Frumento Toscana 6153 Umbria 5069 Marche 8430 Lazio 4416 Abruzzo 3799 Molise 3056 Somma 30923 50 απο = 1 Σχ, i=1 II 30923 6 =5153.8

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 17

Un difetto della media aritmetica

Non è infrequente che insiemi di dati contengano una piccola frazione di osservazioni (al limite una sola osservazione) "anomale" nel senso che assumono valori lontani (ad es. molto più grandi) da quelli assunti dalla maggior parte delle osservazioni. In simili circostanze la media aritmetica assumerà un valore che è ancora un punto di equilibrio per la somma delle modalità, ma non è più un valore equamente rappresentativo di tutte le osservazioni. In altre parole, la media aritmetica può essere molto sensibile alla presenza di osservazioni anomale.

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 19

Media aritmetica - Popolazione divisa in gruppi (5)

Analogamente per il Sud e le isole avremo che:

26765 X andtake =12x; = 26765 = 4460.8 i=1

E' facile verificare che la media pesata delle medie coincide con la media calcolata sul collettivo di tutte le regioni:

3965.5×8+5154.8×6+4461.8×6 = 4470.2 20

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 18

Un'avvertenza sulla media di trasformazioni non lineari dei dati

La media di una trasformazione non lineare dei dati non è in generale uguale alla stessa trasformazione applicata ai dati. Si consideri ad esempio la trasformazione non lineare consistente nel prendere il quadrato delle modalità assunte da una variabile X, ovvero y =x} i =1, ... ,n. Allora

n =1 1 i=1

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 20

Media aritmetica in una distribuzione di frequenza (1)

Se le n osservazioni sono classificate in distribuzione di frequenza secondo le K modalità puntuali di un carattere discreto, la media aritmetica è:

₹=,M(X)= n x,M1 +x2M2 + ... +xnk == 5 xnk. n k=1

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano

Media aritmetica in una distribuzione di frequenza (3)

Se l'ammontare Ax è noto per ogni classe, si considera la somma sulle classi dell'ammontare

₹= ,M(X) =- LA n k=1

Media aritmetica in una distribuzione di frequenza (2)

Quando la variabile X è divisa in intervalli non è possibile calcolare l'ammontare effettivo del carattere, ma si può cercare di approssimarlo assumendo che tutte le unità della k-esima classe abbiano la medesima modalità &,:

x=1M(X) =- Exm2. 1 k=1

La modalità x generalmente è posta pari al valore centrale dell'intervallo per classi chiuse, mentre per classi aperte è necessario scegliere un valore che sintetizzi la distribuzione del carattere su quell'intervallo.

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 22

Esempio (1)

Riconsideriamo l'esempio dei dati sulle precipitazioni annue a Nevada City e la distribuzione dei dati ottenuta raggruppando le osservazioni in 12 classi di ampiezza costante 10.

Rainfall 0-|10 0 Per calcolare la media aritmetica 10-|20 1 20-130 5 30-140 21 40-150 21 50-160 27 Possiamo ipotizzare che le 60-170 16 70-180 13 80-190 1 90-|100 0 100-|110 1 110-|120 0 Somma 106 dobbiamo sostituire all'intervallo di valori che definisce una classe, un valore singolo. osservazioni si distribuiscano in modo uniforme nell'intervallo della classe e scegliere il punto medio come "rappresentativo" della classe.

24

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano

Unità 5 - Corso di Statistica (CLASFA) - C. Trivisano 23

21

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.