Range, varianza e deviazione standard in statistica, IULM Università

Slide da IULM Università Iulm su range, varianza e deviazione standard. Il Pdf esplora le misure di variabilità in statistica, con esempi pratici per calcolare e interpretare i concetti chiave di matematica a livello universitario.

Mostra di più

16 pagine

61
Si supponga di indagare due agenzie di viaggio, dove ognuna di loro impiega 9 dipendenti. La seguente
distribuzione presenta il numero di anni di esperienza nel settore dei viaggi che i 9 dipendenti hanno:
Confrontando gli istogrammi dell’Agenzia A e B
o Possiamo notare che la distribuzione degli anni di esperienza del dipendenti che lavorano presso l’Agenzia
A ha un centro molto più pronunciato, mentre la distribuzione degli anni di esperienza del dipendenti che
lavorano presso l’Agenzia B mostra le sezioni finali (sia destra che sinistra) più pronunciate.
o Quindi, nonostante le agenzie A e B abbiano mostrato una identico intervallo di variazione in merito agli
anni di esperienza dei dipendenti, l’Agenzia B presenta un’esperienza più variabile o dispersa dei
dipendenti rispetto all’Agenzia A
LA VARIABILITÀ
Si supponga di considerare l’esempio precedente delle due agenzie di viaggio. Si consideri quindi la distribuzione
del numero di anni di esperienza nel settore dei viaggi dei 9 dipendenti
Document shared on https://www.docsity.com/it/business-analytics-appunti/10889013/
Downloaded by: pietro_ambesi (pietroambesi@icloud.com)
62
Agenzia A e B hanno lo stesso intervallo di variazione e anche la stessa media. Ma come abbiamo visto
nell’istogramma la distribuzione è diversa, quindi se andiamo confrontare due distribuzioni e ci rendiamo conto
che hanno la stessa media dobbiamo accompagnare la misura di centralità sempre con una misura di variabilità
perché non dobbiamo presupporre che le due distribuzioni anche se hanno la stessa misura di centralità siano
perfettamente identiche
VARIANZA E DEVIAZIONE STANDARD
La misura in grado di rispondere a tali domande è la Deviazione Standard che si ottiene da un’altra misura detta
Varianza.
o La Varianza e la Deviazione Standard (SD) sono misure di variabilità dalla media. Esse restituiscono un
unico valore che indica la quantità di dispersione presente in una distribuzione, o la distanza media dei
valori della distribuzione dalla media.
o La SD si ottiene dalla Varianza (come radice quadrata della Varianza) e permette di ottenere una misura
nelle stesse unità dei dati originali.
Formula varianza per la popolazione sigma al quadrato=(sommatoria di ogni modalità-media) tutto al
quadrato/N (collettivo)
Formula varianza per il campione al denominatore abbiamo n-1
La varianza è al quadrato. La deviazione è la radice quadrata della varianza
Scarto quadratico medio si riferisce solo alla popolazione
La varianza e lo scarto quadratico medio tengono conto di tutte le osservazioni e mettono a confronto ogni
valore con la media aritmetica:
o La varianza non possiede la stessa unità di misura dei valori della distribuzione valori al quadrato
o la deviazione standard o scarto quadratico medio è espresso nella stessa unità di misura della variabile
o varianza e deviazione standard o scarto quadratico medio non possono assumere un valore negativo
differenza al quadrato
ESEMPIO: Si consideri la seguente distribuzione del fatturato annuale
(in migliaia di euro) di 5 strutture alberghiere di una zona sciistica
italiana. Dopo alcune elaborazioni, possiamo affermare che il
fatturato medio annuale delle strutture alberghiere sia pari a 270 mila
euro. Quanto variano i fatturati annuali di ogni albergo rispetto al
valore medio?
Document shared on https://www.docsity.com/it/business-analytics-appunti/10889013/
Downloaded by: pietro_ambesi (pietroambesi@icloud.com)

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

Valori Minimi e Massimi

x(minimum) x(maximum) Valore più piccolo Valore più grande Range Range = Valore più grande - Valore più piccolo

. Si supponga di indagare due agenzie di viaggio, dove ognuna di loro impiega 9 dipendenti. La seguente distribuzione presenta il numero di anni di esperienza nel settore dei viaggi che i 9 dipendenti hanno: dipendenti hanno:

Esperienza Dipendenti Agenzia A e B

Agenzia A 0 4 4 5 7 8 10 11 15 Agenzia B 0 0 4 4 7 10 10 14 15

Calcolo del Range

RANGE = x(maximum) - X(minimum) R(A) = 15-0=15 R(B) = 15-0=15 L'intervallo di variazione dell'Agenzia A e dell'Agenzia B è esattamente lo stesso, ma ciò non significa necessariamente che le osservazioni nelle due distribuzioni siano distribuite esattamente nello stesso modo.

Istogrammi di Esperienza

Istogramma Agenzia A Istogramma Agenzia B 3.5 25 3 2 25 Numero di dipendenti 2 Numero di dipendenti 0,5 0,5 0 0 0-2 3.5 6-8 9-11 12-15 Esperienza (anni) 0-2 3.5 6-8 9-11 12-15 Esperienza (anni)

Confronto Istogrammi Agenzia A e B

  • Confrontando gli istogrammi dell'Agenzia A e B

  • Possiamo notare che la distribuzione degli anni di esperienza del dipendenti che lavorano presso l'Agenzia A ha un centro molto più pronunciato, mentre la distribuzione degli anni di esperienza del dipendenti che lavorano presso l'Agenzia B mostra le sezioni finali (sia destra che sinistra) più pronunciate.

  • Quindi, nonostante le agenzie A e B abbiano mostrato una identico intervallo di variazione in merito agli anni di esperienza dei dipendenti, l'Agenzia B presenta un'esperienza più variabile o dispersa dei dipendenti rispetto all'Agenzia A

La Variabilità

  • Si supponga di considerare l'esempio precedente delle due agenzie di viaggio. Si consideri quindi la distribuzione del numero di anni di esperienza nel settore dei viaggi dei 9 dipendenti 61 Document shared on https://www.docsity.com/it/business-analytics-appunti/10889013/ Downloaded by: pietro_ambesi (pietroambesi@icloud.com)

Dati Dipendenti Agenzia A e B

1Dipendente Agenzia A Agenzia B 0 0 2 4 0 3 4 4 4 5 4 5 7 7 6 8 10 7 10 10 8 11 14 9 15 15

Media Anni di Esperienza

MEDIA 7.11 7.11 Le due distribuzioni presentano un valore medio di 7,11 anni di esperienza, quindi sia nell'Agenzia A che nell'Agenzia B la media è uguale. Quindi: · La distribuzione dell'Agenzia A è uguale a quella dell'Agenzia B? · Hanno la stessa variabilità di anni di esperienza tra i dipendenti?

. Agenzia A e B hanno lo stesso intervallo di variazione e anche la stessa media. Ma come abbiamo visto nell'istogramma la distribuzione è diversa, quindi se andiamo confrontare due distribuzioni e ci rendiamo conto che hanno la stessa media dobbiamo accompagnare la misura di centralità sempre con una misura di variabilità perché non dobbiamo presupporre che le due distribuzioni anche se hanno la stessa misura di centralità siano perfettamente identiche

Varianza e Deviazione Standard

. La misura in grado di rispondere a tali domande è la Deviazione Standard che si ottiene da un'altra misura detta Varianza.

  • La Varianza e la Deviazione Standard (SD) sono misure di variabilità dalla media. Esse restituiscono un unico valore che indica la quantità di dispersione presente in una distribuzione, o la distanza media dei valori della distribuzione dalla media.

  • La SD si ottiene dalla Varianza (come radice quadrata della Varianza) e permette di ottenere una misura nelle stesse unità dei dati originali.

Formule Varianza e Deviazione Standard

Varianza Σ(χ-μ)} i=] Popolazione: o = N Scarto quadratico medio (sqm) o Deviazione standard Σ(x,-μ)} o=1 N É(x,-x)2 Campione: S E(x-x)2 i=1 n-1 s = 1=1 n-1

  • Formula varianza per la popolazione -> sigma al quadrato=(sommatoria di ogni modalità-media) tutto al quadrato/N (collettivo)

  • Formula varianza per il campione -> al denominatore abbiamo n-1

  • La varianza è al quadrato. La deviazione è la radice quadrata della varianza

  • Scarto quadratico medio si riferisce solo alla popolazione

. La varianza e lo scarto quadratico medio tengono conto di tutte le osservazioni e mettono a confronto ogni valore con la media aritmetica:

  • La varianza non possiede la stessa unità di misura dei valori della distribuzione -> valori al quadrato

  • la deviazione standard o scarto quadratico medio è espresso nella stessa unità di misura della variabile

  • varianza e deviazione standard o scarto quadratico medio non possono assumere un valore negativo -> differenza al quadrato

Esempio Fatturato Annuale Alberghi

· ESEMPIO: Si consideri la seguente distribuzione del fatturato annuale (in migliaia di euro) di 5 strutture alberghiere di una zona sciistica italiana. Dopo alcune elaborazioni, possiamo affermare che il fatturato medio annuale delle strutture alberghiere sia pari a 270 mila euro. Quanto variano i fatturati annuali di ogni albergo rispetto al valore medio? Albergo Fatturato (in migliaia di euro) 1 50 2 100 3 300 4 400 5 500 62 Document shared on https://www.docsity.com/it/business-analytics-appunti/10889013/ Downloaded by: pietro_ambesi (pietroambesi@icloud.com)

Sintetizzare le Osservazioni di una Variabile: Le Misure di Variabilità o Dispersione

Misure di Variabilità

. La variabilità si può misurare con diversi tipi di indicatori. Una misura di variabilità deve soddisfare almeno i seguenti requisiti:

  • Assumere valore uguale a zero se tutte le unità presentano uguale modalità della variabile -> variabilità nulla

  • Assumere valori positivi quando le modalità assunte dalle unità non sono uguali

  • Aumentare al crescere della diversità tra le modalità assunte dalle varie unità

  • Dopo aver appreso le misure di posizione o centralità più utilizzate, affrontiamo le misure di variabilità o dispersione, cosiddette per indicare quanto sia variabile un insieme di osservazioni.

  • Anche per le misure di variabilità esistono diverse misure:

Tipi di Misure di Variabilità

  • RANGE O INTERVALLO DI VARIAZIONE

  • INTERVALLO INTERQUARTILE (IQR)

  • VARIANZA

  • DEVIAZIONE STANDARD

  • Z-SCORE RANGE

Range o Intervallo di Variazione

. Il range o intervallo di variazione è la misura più semplice di dispersione e rappresenta la differenza tra il valore più alto e il valore più piccolo di una distribuzione.Range IULM università iulm

Esempio Range Hotel A e B

Fornitore Hotel A Hotel B 1 30 28 2 21 26 3 32 28 4 31 19 5 30 28 6 29 32 7 23 26 8 26 29 9 30 36 10 30 30 TOTALE 282 282 MEDIA 28,2 28,2 Range = Xmax - Xmin RA= 32 - 21 = 11 RB= 36 - 19 = 17IULM università iulm

Varianza, Deviazione Standard, Scarto Quadratico Medio

La deviazione standard è la radice quadrata della varianza ed è una misura che esprime quanto ciascuna modalità si discosta dalla media.

Formule Varianza e Scarto Quadratico Medio

Varianza Popolazione: o2 = = 1 N Σ(x,-μ)2 N Scarto quadratico medio (sqm) o Deviazione standard N E(x; - p)2 i=1 o = 1 N n >(x,-x)2 Σ(x1-x)2 i=1 n Campione: s2 = 1=1 s =1 n-1 n-1IULM università iulm

Applicazione Formula Varianza Popolazione

Varianza, deviazione standard, scarto quadratico medio N Σ(x-H)2 Popolazione: o2 = i=1 N 1. Calcolare gli scarti dalla media X V fx =B2-B$13 A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 I=B2-B$13 3 2 21 4 3 32 5 4 31 6 5 30 7 6 29 8 7 23 9 8 26 10 9 30 11 10 30 12 TOTALE 282 13 MEDIA 28,2 2. Calcolare gli scarti dalla media al quadrato x V fx =C2^2 A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 1,81=C2^2 3 2 21 -7,2 4 3 32 3,8 5 4 31 2,8 6 5 30 1,8 7 6 29 0,8 8 7 23 -5,2 9 8 26 -2,2 10 9 30 1,8 11 10 30 1,8 12 TOTALE 282 13 MEDIA 28,2 N Σ(x,-μ)2

Calcolo Varianza e Scarto Quadratico Medio

Varianza, deviazione standard, scarto quadratico medio N Σ(x ;- μ)2 Popolazione: o2 = i=1 N 3. Dividere la somma degli scarti al quadrato e il numero di osservazioni (N = 10) per ottenere la Varianza × V fx |=D12/10 A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 1,8 3,24 3 2 21 -7,2 51,84 4 3 32 3,8 14,44 5 4 31 2,8 7,84 6 5 30 1,8 3,24 7 6 29 0,8 0,64 8 7 23 -5,2 27,04 9 8 26 -2,2 4,84 10 9 30 1,8 3,24 11 10 30 1,8 3,24 12 TOTALE 282 119,6 13 MEDIA 28,2 14 VARIANZA =D12/10| 15 N Σ(x,-μ)2 i=1 o =1 N 4. Porre la radice quadrata della Varianza per ottenere lo sqm × fx =RADQ(D14) A B C D 1 Fornitore Hotel A (xi - media di x) (xi - media di x) ^2 2 1 30 1,8 3,24 3 2 21 -7,2 51,84 4 3 32 3,8 14,44 5 4 31 2,8 7,84 6 5 30 1,8 3,24 7 6 29 0,8 0,64 8 7 23 -5,2 27,04 9 8 26 -2,2 4,84 10 9 30 1,8 3,24 11 10 30 1,8 3,24 12 TOTALE 282 119,6 13 MEDIA 28,2 14 VARIANZA 11,96] 15 DEV. STANDARD =RADQ(D14) 16 IULM università iulm

Media Distribuzioni di Frequenza

Calcolo Media per Popolazione e Campione

IULM università iulm Media distribuzioni di frequenza POPOLAZIONE k 1 N i=1 CAMPIONE k x =- Ex;n; n i=1 1. Moltiplicare ogni valore di X per la frequenza assoluta (n;) A B C 1 xi ni xi * ni 2 18 1 I=A2*B2 3 22 3 66 4 23 1 23 5 24 1 24 6 26 2 52 7 27 2 54 8 28 2 56 9 29 2 58 10 30 1 30 11 31 1 31 12 32 2 64 13 33 2 66 2. Sommare i prodotti tra i valori di X e frequenze assolute (n;) A B C 1 xi ni xi * ni 2 18 1 18 3 22 3 66 4 23 1 23 5 24 1 24 6 26 2 52 7 27 2 54 8 28 2 56 9 29 2 58 10 30 1 30 11 31 1 31 12 32 2 64 13 33 2 66 14 TOTALE 20 542 3. Dividere la somma dei prodotti tra i valori di X e la frequenza assoluta (ni) per il totale delle ni . × V fx =C14/B14 A B C D 1 xi ni xi * ni (xi - media x) 2 18 1 18 -9,1 3 22 3 66 -5,1 4 23 1 23 -4,1 5 24 1 24 -3,1 6 26 2 52 -1,1 7 27 2 54 -0,1 8 28 2 56 0,9 9 29 2 58 1,9 10 30 1 30 2,9 11 31 1 31 3,9 12 32 2 64 4,9 13 33 2 66 5,9 14 TOTALE I 20 542 15 MEDIA I=C14/B14IULM università iulm

Mediana Distribuzioni di Frequenza

Calcolo Mediana

Mediana distribuzioni di frequenza 1. Calcolare le frequenze cumulate (Ni) 25 xi ni Ni 26 18 1 1 27 22 3 4 28 23 1 5 29 24 1 6 30 26 2 8 31 27 2 10 32 28 2 12 33 29 2 14 34 30 1 15 35 31 1 16 36 32 2 18 37 33 2 20 38 TOTALE 20 An 2. Determinare se N (o n) è pari o dispari N = 20 quindi M= 2 2 = 10^ e 11^ posizione 3. Determinare a quale modalità appartengono le posizioni 10 e 11 e fare la loro media. M = [27+28] = 27,5 x m +x n :+1 2 x [20] [2]+ x 20 - +1 2 2IULM università iulm

Varianza, Deviazione Standard, Scarto Quadratico Medio per Distribuzioni di Frequenze

Calcolo Scarti dalla Media

Varianza, deviazione standard, scarto quadratico medio per distribuzioni di frequenze 1. Calcolare gli scarti dalla media × V fx | =A2-C$15 A B C D 1 xi ni xi * ni (xi - media x) 2 18 1 18 =A2-C$15 3 22 3 66 -5,1 4 23 1 23 -4,1 5 24 1 24 -3,1 6 26 2 52 -1,1 7 27 2 54 -0,1 8 28 2 56 0,9 9 29 2 58 1,9 10 30 1 30 2,9 11 31 1 31 3,9 12 32 2 64 4,9 13 33 2 66 5,9 14 TOTALE 20 542 15 MEDIA 27,1

Elevare al Quadrato gli Scarti dalla Media

1 2. Elevare al quadrato gli scarti dalla media X V fx | =D2^2 A B C D E 1 xi ni xi * ni (xi - media x) (xi - media x)2 2 18 1 18 I -9,1 [=D2^2| 3 22 3 66 -5,1 26,01 4 23 1 23 -4,1 16,81 5 24 1 24 -3,1 9,61 6 26 2 52 -1,1 1,21 7 27 2 54 -0,1 0,01 8 28 2 56 0,9 0,81 9 29 2 58 1,9 3,61 10 30 1 30 2,9 8,41 11 31 1 31 3,9 15,21 12 32 2 64 4,9 24,01 13 33 2 66 5,9 34,81 14 TOTALE 20 542 15 MEDIA 27,1

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.