LEZIONE 7 RIPRENDIAMO LA LEZIONE 5
VARIABILI ALEATORIE CONCETTI CHIAVE
- VARIABILE ALEATORIA:
- DISCRETA
- CONTINUA
- FUNZIONE DI PROBABILITA' DISCRETA:
- f (x) = P(X = x), x = x1x2 ... . . , xk
- 0 ≤ f(x) ≤1
- Exf(x) =1
- FUNZIONE DI DENSITA' f (x)
- è positiva (il grafico dell'equazione deve essere al di sopra dell'asse orizzontale).
- L'area totale sottesa dal grafico dell'equazione su tutti i possibili valori assunti dalla v.a.
deve essere pari a 1.
PRINCIPALI DISTRIBUZIONI DI PROBABILITA'
- DISTRIBUZIONI DELLE V.C. DISCRETE:
- UNIFORME
- DI BERNOULLI
- BINOMIALE
- DI POISSON
- DISTRIBUZIONI DELLE V.C. CONTINUE
- RETTANGOLARE
- ESPONENZIALI
- NORMALE
- CHI-QUADRATO
COS'È LA DISTRIBUZIONE NORMALE?
THE
NORMAL
LAW OF ERROR
STANDS OUT IN THE
EXPERIENCE OF MANKIND
AS ONE OF THE BROADEST
GENERALIZATIONS OF NATURAL
PHILOSOPHY . IT SERVES AS THE
GUIDING INSTRUMENT IN RESEARCHES
IN THE PHYSICAL AND SOCIAL SCIENCES AND
IN MEDICINE AGRICULTURE AND ENGINEERING
IT IS AN INDISPENSABLE TOOL FOR THE ANALYSIS AND THE
INTERPRETATION OF THE BASIC DATA OBTAINED BY OBSERVATION AND EXPERIMENT
(J. Youden )
SCALA DI WESHLER DELL'INTELLIGENZA
3
2
Population, %
1
0
60
70
80
90
100
110
120
130
140
IQ
LA V.A. NORMALE O GAUSSIANA
La distribuzione normale (o distribuzione Gaussiana) è la distribuzione
continua più utilizzata in statistica.
La distribuzione normale è importante in statistica per tre motivi
fondamentali:
- Diversi fenomeni continui sembrano seguire, almeno
approssimativamente, una distribuzione normale.
- La distribuzione normale può essere utilizzata per approssimare
numerose distribuzioni di probabilità discrete.
- La distribuzione normale è alla base dell'inferenza statistica classica
in virtù del teorema del limite centrale
LA V.A. NORMALE
Una v.a. X ha una distribuzione normale, con media u e varianza o2
se la sua funzione di densità di probabilità è data da:
f(x) =
1
σ12π
x-μ
6
2
e
u,o2 = parametri della v.a. normale;
T = la costante 3,14 ...;
e = numero di Nepero, base dei logaritmi
naturali (2,7183 ... ),
LA DISTRIBUZIONE NORMALE
L'area totale sottesa alla curva è pari a 1, e la curva è simmetrica, perciò metà è al di sopra della media, e
metà è al di sotto
f(x)
P(-00
CARATTERISTICHE DELLA V.A. NORMALE
- La v.a. normale è continua
- Assume valori su tutto l'asse reale R, compresi tra -00 e +00
- Descrive una curva di tipo simmetrico, di forma campanulare che presenta le
seguenti caratteristiche:
- la curva è perfettamente simmetrica al livello di x in cui la funzione f(x) raggiunge il suo punto
più alto, che è in corrispondenza di xi = µ
- Da ciò consegue che media, mediana e moda coincidono
- La sua funzione di densità f(x) è asintotica per x=0, con x che tende e -% e a +% (la curva si
avvicina all'asse delle ascisse senza mai arrivare a toccarla); [?]
- è crescente per valori della x che vanno da - a u, mentre è decrescente per valori della x
che vanno da u a +%;
- I punti di flesso sono situati a u - o e u + o
f(x)
μ- μ μισ
x
V.A. NORMALE
- Intervalli tipici:
- il 68% circa dell'area sottesa dalla curva normale è compreso tra u - o e u + o
- I| 95% circa dell'area sottesa dalla curva normale è compreso tra u - 20 e u + 20
- I| 99,7% circa dell'area sottesa dalla curva normale è compreso tra u - 30 e u +
30
99.74%
95.44%
68.26%
>
μ -3σ μ - 20 μ - σ
μ+σ μ + 20 μ + 30
V.A. NORMALE
- ogni v.a. normale è univocamente definita dalla propria media e dalla
propria varianza: N ~ (1,6)
- AREA SOTTESA DALLA CURVA NORMALE per qualsiasi intervallo di
valori della v.c. X rappresenta:
- La quota della popolazione avente le caratteristiche dall'intervallo di valori o
- La probabilità che un individuo selezionato casualmente dalla popolazione
abbia le caratteristiche descritte dall'intervallo di valori
V.A. NORMALE
Varie distribuzioni normali, pertanto, possono differire per la media e la varianza,
nonostante mantengano costanti le altre loro caratteristiche
o = 2
= = 5
μ= 1
u = 7
V.A. NORMALE
+
1,2
0,8 -
o = 1/3
0,4
o = 1/2
o= 1
T
-1
0
1
2
3
4
5 x
All'aumentare della
varianza la curva si
appiattisce
Stessa media, diversa varianza
V.A. NORMALE
Si ha una semplice traslazione della curva
0.6
0.4
0.2
1
A
7
0 1 2 3 4 5 6 7 8 9 10 11 12
Diversa media, stessa varianza
Come si calcola l'area sottostante
la curva normale?
LA DISTRIBUZIONE NORMALE
STANDARDIZZATA
- La distribuzione normale è difficilmente trattabile dal punto di vista
calcolatorio, a causa dei suoi due parametri, u e o2.
- Si potrebbe usare tabelle predefinite per il calcolo delle aree, ma
dovremmo avere una tabella per ogni coppia di media e di deviazione
standard
- La soluzione è usare lo z-score, cioè standardizzare la v.c.
- In questo modo abbiamo bisogno solo di una tabella di aree che
corrisponde alla distribuzione normale standardizzata
LA DISTRIBUZIONE NORMALE
STANDARDIZZATA
Si supponga che la v.c. X si distribuisca normalmente con media u e
deviazione standard o. La variabile casuale Z allora si ottiene mediante
una trasformazione della variabile X:
X - u
Z =
0
E si distribuisce normalmente con con u=0 e o=1
LA DISTRIBUZIONE NORMALE
STANDARDIZZATA
La standardizzazione è una trasformazione dei dati che consiste nel:
rendere la media nulla (p = 0), dato che ad ogni valore della variabile
originaria viene sottratta la media della variabile stessa;
assumere la deviazione standard o quale unità di misura (o = 1) della nuova
variabile, dato che ogni valore viene diviso per o.
La distribuzione normale standardizzata viene indicata con N(0,1).
I valori della Z sono tabulati: tra qualche diapositiva vedremo la tavola
della Z.
LA DISTRIBUZIONE NORMALE
STANDARDIZZATA
0.4
0.3
flesso
& flesso
Densità
0.2
0.1
Oz= 1
Oz=1
0.0
-3
-2
-1
0
1
2
3
Z
Hz = 0,
oz = 1
LA DISTRIBUZIONE NORMALE
STANDARDIZZATA
f(x)
201 01
202 02
μι
X1 X2
μ1 + 1 0 μ2 - 202.
με'
μ1-201
M2+02
-
f(z)
-
-3-2-10 123 %
AREE SOTTESE DALLA CURVA NORMALE
GENERALE E STANDARDIZZATA
- La probabilità che un valore estratto
casualmente da una v.a. N (u,o) sia
compreso nell'intervallo (u- o, u+o) è pari
al 68%;
- Il 95% dei valori assunti da una
distribuzione Normale cadono
nell'intervallo (μ-1,960, μ+1,96);
- Il 99%, invece, nell'intervallo (u-2,580,
μ+2,58σ);
68%
μ - 1.96 g
με + 1.96 g
x
μ - 2.58 g
μ-σ
11+0
μ + 2.58 σ
(a)
95%
99%
68%
-2.58 -1.96
-1
0
+1
+1.96 +2.58
(b)
Z=
(x-x)
AREE SOTTESE DALLA CURVA NORMALE
STANDARDIZZATA
La distribuzione normale standardizzata è importante perché le
probabilità corrispondenti alle aree sottese dalla curva normale
possono essere calcolate.
Queste probabilità vengono riportate in apposite tavole.
In questo modo è possibile evitare il ricorso a complessi calcoli integrali
per trovare le probabilità che una v.a. X assuma valori compresi
all'interno di determinati intervalli.
AREE SOTTESE DALLA CURVA NORMALE
STANDARDIZZATA
È noto che il 68,26% dell'area totale è compreso tra +1 deviazioni
standard attorno alla media, cioè a +1 punti z dalla media; mentre il
95,44% è racchiuso tra +2 deviazioni standard attorno alla media:
quindi a +2 punti z dalla media.
AREE SOTTESE DALLA CURVA NORMALE
STANDARDIZZATA
In virtù della proprietà di simmetria della distribuzione normale, le
tavole riportano soltanto i valori dell'area compresa fra lo zero e
l'ascissa +X, poiché, per la simmetria, l'area sottesa dall'altra metà della
curva è ovviamente uguale.
Osservando la tavola, si troveranno i punti z nella colonna di sinistra
con una cifra decimale; la seconda cifra decimale è posta nella prima
riga in alto della stessa tavola.
IN TERMINI PRATICI ..
. Supponiamo di voler conoscere l'area compresa tra le ascisse pari,
rispettivamente, a z=0 e z=1,96.
0,4750
0
1,96
IN TERMINI PRATICI ..
- Osservando la colonna dei punti z, si deve scendere fino a trovare
z=1,9, e poi rimanere nella stessa riga fino a trovarsi in quella indicata
con 6.
- Il punteggio che si trova in quel punto indica la porzione di area a
sinistra di z=1,96 è 0.975.
- Poiché l'area a sinistra di z=0 è 0.500, l'area della distribuzione
compresa tra z=0 e z=1,96 è data da 0.975 - 0.500= 0,47502
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.684
0.6879
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.6
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.8
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0.9
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
0.831
0.8340
0.8365
0.8389
1.0
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
1.1
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
1.2
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
1.3
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
1.4
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
1.5
0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
0.9406
0.9418
0.9429
0.9441
1.6
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
1.7
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
1.8
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
1.9
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9756
0.9761
0.9767
2.0
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9808
0.9812
0.9817
2.1
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9850
0.9854
0.9857
2.2
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9884
0.9887
0.9890
2.3
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
2.4
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
2.5
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
2.6
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
2.7
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
2.8
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
2.9
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
3.0
0.9987
0.9987
0.9987
0.9988
0.9988
0.9989
0.9989
0.9989
0.9990
0.9990
3.1
0.9990
0.9991
0.9991
0.9991
0.9992
0.9992
0.9992
0.9992
0.9993
0.9993
3.2
0.9993
0.9993
0.9994
0.9994
0.9994
0.9994
0.9994
0.9995
0.9995
0.9995
3.3
0.9995
0.9995
0.9995
0.9996
0.9996
0.9996
0.9996
0.9996
0.9996
0.9997
3.4
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9997
0.9998
TAB.1 - TAVOLA DELLA
DISTRIBUZIONE NORMALE
STANDARDIZZATA
(z)
0
2
0.9750
0.9803
0.9846
0.9881