Slide da IULM Università Iulm su range, varianza e deviazione standard. Il Pdf esplora le misure di variabilità in statistica, con esempi pratici per calcolare e interpretare i concetti chiave di matematica a livello universitario.
Mostra di più16 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
x(minimum) x(maximum) Valore più piccolo Valore più grande Range Range = Valore più grande - Valore più piccolo
. Si supponga di indagare due agenzie di viaggio, dove ognuna di loro impiega 9 dipendenti. La seguente distribuzione presenta il numero di anni di esperienza nel settore dei viaggi che i 9 dipendenti hanno: dipendenti hanno:
Agenzia A 0 4 4 5 7 8 10 11 15 Agenzia B 0 0 4 4 7 10 10 14 15
RANGE = x(maximum) - X(minimum) R(A) = 15-0=15 R(B) = 15-0=15 L'intervallo di variazione dell'Agenzia A e dell'Agenzia B è esattamente lo stesso, ma ciò non significa necessariamente che le osservazioni nelle due distribuzioni siano distribuite esattamente nello stesso modo.
Istogramma Agenzia A Istogramma Agenzia B 3.5 25 3 2 25 Numero di dipendenti 2 Numero di dipendenti 0,5 0,5 0 0 0-2 3.5 6-8 9-11 12-15 Esperienza (anni) 0-2 3.5 6-8 9-11 12-15 Esperienza (anni)
Confrontando gli istogrammi dell'Agenzia A e B
Possiamo notare che la distribuzione degli anni di esperienza del dipendenti che lavorano presso l'Agenzia A ha un centro molto più pronunciato, mentre la distribuzione degli anni di esperienza del dipendenti che lavorano presso l'Agenzia B mostra le sezioni finali (sia destra che sinistra) più pronunciate.
Quindi, nonostante le agenzie A e B abbiano mostrato una identico intervallo di variazione in merito agli anni di esperienza dei dipendenti, l'Agenzia B presenta un'esperienza più variabile o dispersa dei dipendenti rispetto all'Agenzia A
Si supponga di considerare l'esempio precedente delle due agenzie di viaggio. Si consideri quindi la distribuzione del numero di anni di esperienza nel settore dei viaggi dei 9 dipendenti 61 Document shared on https://www.docsity.com/it/business-analytics-appunti/10889013/ Downloaded by: pietro_ambesi (pietroambesi@icloud.com)
1Dipendente Agenzia A Agenzia B 0 0 2 4 0 3 4 4 4 5 4 5 7 7 6 8 10 7 10 10 8 11 14 9 15 15
MEDIA 7.11 7.11 Le due distribuzioni presentano un valore medio di 7,11 anni di esperienza, quindi sia nell'Agenzia A che nell'Agenzia B la media è uguale. Quindi: · La distribuzione dell'Agenzia A è uguale a quella dell'Agenzia B? · Hanno la stessa variabilità di anni di esperienza tra i dipendenti?
. Agenzia A e B hanno lo stesso intervallo di variazione e anche la stessa media. Ma come abbiamo visto nell'istogramma la distribuzione è diversa, quindi se andiamo confrontare due distribuzioni e ci rendiamo conto che hanno la stessa media dobbiamo accompagnare la misura di centralità sempre con una misura di variabilità perché non dobbiamo presupporre che le due distribuzioni anche se hanno la stessa misura di centralità siano perfettamente identiche
. La misura in grado di rispondere a tali domande è la Deviazione Standard che si ottiene da un'altra misura detta Varianza.
La Varianza e la Deviazione Standard (SD) sono misure di variabilità dalla media. Esse restituiscono un unico valore che indica la quantità di dispersione presente in una distribuzione, o la distanza media dei valori della distribuzione dalla media.
La SD si ottiene dalla Varianza (come radice quadrata della Varianza) e permette di ottenere una misura nelle stesse unità dei dati originali.
Varianza Σ(χ-μ)} i=] Popolazione: o = N Scarto quadratico medio (sqm) o Deviazione standard Σ(x,-μ)} o=1 N É(x,-x)2 Campione: S E(x-x)2 i=1 n-1 s = 1=1 n-1
Formula varianza per la popolazione -> sigma al quadrato=(sommatoria di ogni modalità-media) tutto al quadrato/N (collettivo)
Formula varianza per il campione -> al denominatore abbiamo n-1
La varianza è al quadrato. La deviazione è la radice quadrata della varianza
Scarto quadratico medio si riferisce solo alla popolazione
. La varianza e lo scarto quadratico medio tengono conto di tutte le osservazioni e mettono a confronto ogni valore con la media aritmetica:
La varianza non possiede la stessa unità di misura dei valori della distribuzione -> valori al quadrato
la deviazione standard o scarto quadratico medio è espresso nella stessa unità di misura della variabile
varianza e deviazione standard o scarto quadratico medio non possono assumere un valore negativo -> differenza al quadrato
· ESEMPIO: Si consideri la seguente distribuzione del fatturato annuale (in migliaia di euro) di 5 strutture alberghiere di una zona sciistica italiana. Dopo alcune elaborazioni, possiamo affermare che il fatturato medio annuale delle strutture alberghiere sia pari a 270 mila euro. Quanto variano i fatturati annuali di ogni albergo rispetto al valore medio? Albergo Fatturato (in migliaia di euro) 1 50 2 100 3 300 4 400 5 500 62 Document shared on https://www.docsity.com/it/business-analytics-appunti/10889013/ Downloaded by: pietro_ambesi (pietroambesi@icloud.com)
. La variabilità si può misurare con diversi tipi di indicatori. Una misura di variabilità deve soddisfare almeno i seguenti requisiti:
Assumere valore uguale a zero se tutte le unità presentano uguale modalità della variabile -> variabilità nulla
Assumere valori positivi quando le modalità assunte dalle unità non sono uguali
Aumentare al crescere della diversità tra le modalità assunte dalle varie unità
Dopo aver appreso le misure di posizione o centralità più utilizzate, affrontiamo le misure di variabilità o dispersione, cosiddette per indicare quanto sia variabile un insieme di osservazioni.
Anche per le misure di variabilità esistono diverse misure:
RANGE O INTERVALLO DI VARIAZIONE
INTERVALLO INTERQUARTILE (IQR)
VARIANZA
DEVIAZIONE STANDARD
Z-SCORE RANGE
. Il range o intervallo di variazione è la misura più semplice di dispersione e rappresenta la differenza tra il valore più alto e il valore più piccolo di una distribuzione.Range IULM università iulm
Fornitore Hotel A Hotel B 1 30 28 2 21 26 3 32 28 4 31 19 5 30 28 6 29 32 7 23 26 8 26 29 9 30 36 10 30 30 TOTALE 282 282 MEDIA 28,2 28,2 Range = Xmax - Xmin RA= 32 - 21 = 11 RB= 36 - 19 = 17IULM università iulm
La deviazione standard è la radice quadrata della varianza ed è una misura che esprime quanto ciascuna modalità si discosta dalla media.
Varianza Popolazione: o2 = = 1 N Σ(x,-μ)2 N Scarto quadratico medio (sqm) o Deviazione standard N E(x; - p)2 i=1 o = 1 N n >(x,-x)2 Σ(x1-x)2 i=1 n Campione: s2 = 1=1 s =1 n-1 n-1IULM università iulm
Varianza, deviazione standard, scarto quadratico medio N Σ(x-H)2 Popolazione: o2 = i=1 N 1. Calcolare gli scarti dalla media X V fx =B2-B$13 A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 I=B2-B$13 3 2 21 4 3 32 5 4 31 6 5 30 7 6 29 8 7 23 9 8 26 10 9 30 11 10 30 12 TOTALE 282 13 MEDIA 28,2 2. Calcolare gli scarti dalla media al quadrato x V fx =C2^2 A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 1,81=C2^2 3 2 21 -7,2 4 3 32 3,8 5 4 31 2,8 6 5 30 1,8 7 6 29 0,8 8 7 23 -5,2 9 8 26 -2,2 10 9 30 1,8 11 10 30 1,8 12 TOTALE 282 13 MEDIA 28,2 N Σ(x,-μ)2
Varianza, deviazione standard, scarto quadratico medio N Σ(x ;- μ)2 Popolazione: o2 = i=1 N 3. Dividere la somma degli scarti al quadrato e il numero di osservazioni (N = 10) per ottenere la Varianza × V fx |=D12/10 A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 1,8 3,24 3 2 21 -7,2 51,84 4 3 32 3,8 14,44 5 4 31 2,8 7,84 6 5 30 1,8 3,24 7 6 29 0,8 0,64 8 7 23 -5,2 27,04 9 8 26 -2,2 4,84 10 9 30 1,8 3,24 11 10 30 1,8 3,24 12 TOTALE 282 119,6 13 MEDIA 28,2 14 VARIANZA =D12/10| 15 N Σ(x,-μ)2 i=1 o =1 N 4. Porre la radice quadrata della Varianza per ottenere lo sqm × fx =RADQ(D14) A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 1,8 3,24 3 2 21 -7,2 51,84 4 3 32 3,8 14,44 5 4 31 2,8 7,84 6 5 30 1,8 3,24 7 6 29 0,8 0,64 8 7 23 -5,2 27,04 9 8 26 -2,2 4,84 10 9 30 1,8 3,24 11 10 30 1,8 3,24 12 TOTALE 282 119,6 13 MEDIA 28,2 14 VARIANZA 11,96] 15 DEV. STANDARD =RADQ(D14) 16 IULM università iulm
IULM università iulm Media distribuzioni di frequenza POPOLAZIONE k 1 N i=1 CAMPIONE k x =- Ex;n; n i=1 1. Moltiplicare ogni valore di X per la frequenza assoluta (n;) A B C 1 xi ni xi * ni 2 18 1 I=A2*B2 3 22 3 66 4 23 1 23 5 24 1 24 6 26 2 52 7 27 2 54 8 28 2 56 9 29 2 58 10 30 1 30 11 31 1 31 12 32 2 64 13 33 2 66 2. Sommare i prodotti tra i valori di X e frequenze assolute (n;) A B C 1 xi ni xi * ni 2 18 1 18 3 22 3 66 4 23 1 23 5 24 1 24 6 26 2 52 7 27 2 54 8 28 2 56 9 29 2 58 10 30 1 30 11 31 1 31 12 32 2 64 13 33 2 66 14 TOTALE 20 542 3. Dividere la somma dei prodotti tra i valori di X e la frequenza assoluta (ni) per il totale delle ni . × V fx =C14/B14 A B C D 1 xi ni xi * ni (xi - media x) 2 18 1 18 -9,1 3 22 3 66 -5,1 4 23 1 23 -4,1 5 24 1 24 -3,1 6 26 2 52 -1,1 7 27 2 54 -0,1 8 28 2 56 0,9 9 29 2 58 1,9 10 30 1 30 2,9 11 31 1 31 3,9 12 32 2 64 4,9 13 33 2 66 5,9 14 TOTALE I 20 542 15 MEDIA I=C14/B14IULM università iulm
Mediana distribuzioni di frequenza 1. Calcolare le frequenze cumulate (Ni) 25 xi ni Ni 26 18 1 1 27 22 3 4 28 23 1 5 29 24 1 6 30 26 2 8 31 27 2 10 32 28 2 12 33 29 2 14 34 30 1 15 35 31 1 16 36 32 2 18 37 33 2 20 38 TOTALE 20 An 2. Determinare se N (o n) è pari o dispari N = 20 quindi M= 2 2 = 10^ e 11^ posizione 3. Determinare a quale modalità appartengono le posizioni 10 e 11 e fare la loro media. M = [27+28] = 27,5 x m +x n :+1 2 x [20] [2]+ x 20 - +1 2 2IULM università iulm
Varianza, deviazione standard, scarto quadratico medio per distribuzioni di frequenze 1. Calcolare gli scarti dalla media × V fx | =A2-C$15 A B C D 1 xi ni xi * ni (xi - media x) 2 18 1 18 =A2-C$15 3 22 3 66 -5,1 4 23 1 23 -4,1 5 24 1 24 -3,1 6 26 2 52 -1,1 7 27 2 54 -0,1 8 28 2 56 0,9 9 29 2 58 1,9 10 30 1 30 2,9 11 31 1 31 3,9 12 32 2 64 4,9 13 33 2 66 5,9 14 TOTALE 20 542 15 MEDIA 27,1
1 2. Elevare al quadrato gli scarti dalla media X V fx | =D2^2 A B C D E 1 xi ni xi * ni (xi - media x) (xi - media x)2 2 18 1 18 I -9,1 [=D2^2| 3 22 3 66 -5,1 26,01 4 23 1 23 -4,1 16,81 5 24 1 24 -3,1 9,61 6 26 2 52 -1,1 1,21 7 27 2 54 -0,1 0,01 8 28 2 56 0,9 0,81 9 29 2 58 1,9 3,61 10 30 1 30 2,9 8,41 11 31 1 31 3,9 15,21 12 32 2 64 4,9 24,01 13 33 2 66 5,9 34,81 14 TOTALE 20 542 15 MEDIA 27,1