Lezione 7: Variabili aleatorie, calcolo e identificazione valori anomali

Slide sulle variabili aleatorie e i valori anomali. Il Pdf, utile per lo studio universitario di Matematica, riprende la lezione 5 sulle variabili aleatorie, fornendo definizioni, formule ed esercizi svolti per comprendere e identificare i valori anomali in una distribuzione normale.

Ver más

65 páginas

LEZIONE 7
RIPRENDIAMO LA LEZIONE 5
VARIABILI ALEATORIE

Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

LEZIONE 7 RIPRENDIAMO LA LEZIONE 5

VARIABILI ALEATORIE CONCETTI CHIAVE

  • VARIABILE ALEATORIA:
  • DISCRETA
  • CONTINUA
  • FUNZIONE DI PROBABILITA' DISCRETA:
  • f (x) = P(X = x), x = x1x2 ... . . , xk
  1. 0 ≤ f(x) ≤1
  2. Exf(x) =1
  • FUNZIONE DI DENSITA' f (x)
  • è positiva (il grafico dell'equazione deve essere al di sopra dell'asse orizzontale).
  • L'area totale sottesa dal grafico dell'equazione su tutti i possibili valori assunti dalla v.a. deve essere pari a 1.

PRINCIPALI DISTRIBUZIONI DI PROBABILITA'

  • DISTRIBUZIONI DELLE V.C. DISCRETE:
  • UNIFORME
  • DI BERNOULLI
  • BINOMIALE
  • DI POISSON
  • DISTRIBUZIONI DELLE V.C. CONTINUE
  • RETTANGOLARE
  • ESPONENZIALI
  • NORMALE
  • CHI-QUADRATO

COS'È LA DISTRIBUZIONE NORMALE?

THE NORMAL LAW OF ERROR STANDS OUT IN THE EXPERIENCE OF MANKIND AS ONE OF THE BROADEST GENERALIZATIONS OF NATURAL PHILOSOPHY . IT SERVES AS THE GUIDING INSTRUMENT IN RESEARCHES IN THE PHYSICAL AND SOCIAL SCIENCES AND IN MEDICINE AGRICULTURE AND ENGINEERING IT IS AN INDISPENSABLE TOOL FOR THE ANALYSIS AND THE INTERPRETATION OF THE BASIC DATA OBTAINED BY OBSERVATION AND EXPERIMENT (J. Youden )

SCALA DI WESHLER DELL'INTELLIGENZA

3 2 Population, % 1 0 60 70 80 90 100 110 120 130 140 IQ

LA V.A. NORMALE O GAUSSIANA

La distribuzione normale (o distribuzione Gaussiana) è la distribuzione continua più utilizzata in statistica. La distribuzione normale è importante in statistica per tre motivi fondamentali:

  1. Diversi fenomeni continui sembrano seguire, almeno approssimativamente, una distribuzione normale.
  2. La distribuzione normale può essere utilizzata per approssimare numerose distribuzioni di probabilità discrete.
  3. La distribuzione normale è alla base dell'inferenza statistica classica in virtù del teorema del limite centrale

LA V.A. NORMALE

Una v.a. X ha una distribuzione normale, con media u e varianza o2 se la sua funzione di densità di probabilità è data da: f(x) = 1 σ12π x-μ 6 2 e u,o2 = parametri della v.a. normale; T = la costante 3,14 ...; e = numero di Nepero, base dei logaritmi naturali (2,7183 ... ),

LA DISTRIBUZIONE NORMALE

L'area totale sottesa alla curva è pari a 1, e la curva è simmetrica, perciò metà è al di sopra della media, e metà è al di sotto f(x) P(-00

CARATTERISTICHE DELLA V.A. NORMALE

  • La v.a. normale è continua
  • Assume valori su tutto l'asse reale R, compresi tra -00 e +00
  • Descrive una curva di tipo simmetrico, di forma campanulare che presenta le seguenti caratteristiche:
  • la curva è perfettamente simmetrica al livello di x in cui la funzione f(x) raggiunge il suo punto più alto, che è in corrispondenza di xi = µ
  • Da ciò consegue che media, mediana e moda coincidono
  • La sua funzione di densità f(x) è asintotica per x=0, con x che tende e -% e a +% (la curva si avvicina all'asse delle ascisse senza mai arrivare a toccarla); [?]
  • è crescente per valori della x che vanno da - a u, mentre è decrescente per valori della x che vanno da u a +%;
  • I punti di flesso sono situati a u - o e u + o f(x) μ- μ μισ x

V.A. NORMALE

  • Intervalli tipici:
  • il 68% circa dell'area sottesa dalla curva normale è compreso tra u - o e u + o
  • I| 95% circa dell'area sottesa dalla curva normale è compreso tra u - 20 e u + 20
  • I| 99,7% circa dell'area sottesa dalla curva normale è compreso tra u - 30 e u + 30 99.74% 95.44% 68.26% > μ -3σ μ - 20 μ - σ μ+σ μ + 20 μ + 30

V.A. NORMALE

  • ogni v.a. normale è univocamente definita dalla propria media e dalla propria varianza: N ~ (1,6)
  • AREA SOTTESA DALLA CURVA NORMALE per qualsiasi intervallo di valori della v.c. X rappresenta:
  • La quota della popolazione avente le caratteristiche dall'intervallo di valori o
  • La probabilità che un individuo selezionato casualmente dalla popolazione abbia le caratteristiche descritte dall'intervallo di valori

V.A. NORMALE

Varie distribuzioni normali, pertanto, possono differire per la media e la varianza, nonostante mantengano costanti le altre loro caratteristiche o = 2 = = 5 μ= 1 u = 7

V.A. NORMALE

+ 1,2 0,8 - o = 1/3 0,4 o = 1/2 o= 1 T -1 0 1 2 3 4 5 x All'aumentare della varianza la curva si appiattisce Stessa media, diversa varianza

V.A. NORMALE

Si ha una semplice traslazione della curva 0.6 0.4 0.2 1 A 7 0 1 2 3 4 5 6 7 8 9 10 11 12 Diversa media, stessa varianza

Come si calcola l'area sottostante la curva normale?

LA DISTRIBUZIONE NORMALE STANDARDIZZATA

  • La distribuzione normale è difficilmente trattabile dal punto di vista calcolatorio, a causa dei suoi due parametri, u e o2.
  • Si potrebbe usare tabelle predefinite per il calcolo delle aree, ma dovremmo avere una tabella per ogni coppia di media e di deviazione standard
  • La soluzione è usare lo z-score, cioè standardizzare la v.c.
  • In questo modo abbiamo bisogno solo di una tabella di aree che corrisponde alla distribuzione normale standardizzata

LA DISTRIBUZIONE NORMALE STANDARDIZZATA

Si supponga che la v.c. X si distribuisca normalmente con media u e deviazione standard o. La variabile casuale Z allora si ottiene mediante una trasformazione della variabile X: X - u Z = 0 E si distribuisce normalmente con con u=0 e o=1

LA DISTRIBUZIONE NORMALE STANDARDIZZATA

La standardizzazione è una trasformazione dei dati che consiste nel: rendere la media nulla (p = 0), dato che ad ogni valore della variabile originaria viene sottratta la media della variabile stessa; assumere la deviazione standard o quale unità di misura (o = 1) della nuova variabile, dato che ogni valore viene diviso per o. La distribuzione normale standardizzata viene indicata con N(0,1). I valori della Z sono tabulati: tra qualche diapositiva vedremo la tavola della Z.

LA DISTRIBUZIONE NORMALE STANDARDIZZATA

0.4 0.3 flesso & flesso Densità 0.2 0.1 Oz= 1 Oz=1 0.0 -3 -2 -1 0 1 2 3 Z Hz = 0, oz = 1

LA DISTRIBUZIONE NORMALE STANDARDIZZATA

f(x) 201 01 202 02 μι X1 X2 μ1 + 1 0 μ2 - 202. με' μ1-201 M2+02 - f(z) - -3-2-10 123 %

AREE SOTTESE DALLA CURVA NORMALE GENERALE E STANDARDIZZATA

  • La probabilità che un valore estratto casualmente da una v.a. N (u,o) sia compreso nell'intervallo (u- o, u+o) è pari al 68%;
  • Il 95% dei valori assunti da una distribuzione Normale cadono nell'intervallo (μ-1,960, μ+1,96);
  • Il 99%, invece, nell'intervallo (u-2,580, μ+2,58σ); 68% μ - 1.96 g με + 1.96 g x μ - 2.58 g μ-σ 11+0 μ + 2.58 σ (a) 95% 99% 68% -2.58 -1.96 -1 0 +1 +1.96 +2.58 (b) Z= (x-x)

AREE SOTTESE DALLA CURVA NORMALE STANDARDIZZATA

La distribuzione normale standardizzata è importante perché le probabilità corrispondenti alle aree sottese dalla curva normale possono essere calcolate. Queste probabilità vengono riportate in apposite tavole. In questo modo è possibile evitare il ricorso a complessi calcoli integrali per trovare le probabilità che una v.a. X assuma valori compresi all'interno di determinati intervalli.

AREE SOTTESE DALLA CURVA NORMALE STANDARDIZZATA

È noto che il 68,26% dell'area totale è compreso tra +1 deviazioni standard attorno alla media, cioè a +1 punti z dalla media; mentre il 95,44% è racchiuso tra +2 deviazioni standard attorno alla media: quindi a +2 punti z dalla media.

AREE SOTTESE DALLA CURVA NORMALE STANDARDIZZATA

In virtù della proprietà di simmetria della distribuzione normale, le tavole riportano soltanto i valori dell'area compresa fra lo zero e l'ascissa +X, poiché, per la simmetria, l'area sottesa dall'altra metà della curva è ovviamente uguale. Osservando la tavola, si troveranno i punti z nella colonna di sinistra con una cifra decimale; la seconda cifra decimale è posta nella prima riga in alto della stessa tavola.

IN TERMINI PRATICI ..

. Supponiamo di voler conoscere l'area compresa tra le ascisse pari, rispettivamente, a z=0 e z=1,96. 0,4750 0 1,96

IN TERMINI PRATICI ..

  • Osservando la colonna dei punti z, si deve scendere fino a trovare z=1,9, e poi rimanere nella stessa riga fino a trovarsi in quella indicata con 6.
  • Il punteggio che si trova in quel punto indica la porzione di area a sinistra di z=1,96 è 0.975.
  • Poiché l'area a sinistra di z=0 è 0.500, l'area della distribuzione compresa tra z=0 e z=1,96 è data da 0.975 - 0.500= 0,47502 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.684 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.831 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 TAB.1 - TAVOLA DELLA DISTRIBUZIONE NORMALE STANDARDIZZATA (z) 0 2 0.9750 0.9803 0.9846 0.9881

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.