Slide di Università su distribuzioni di probabilità. Il Pdf, utile per lo studio della Matematica a livello universitario, spiega la teoria della probabilità, le variabili casuali e l'approccio frequentista, con esempi pratici sul lancio di dadi.
Mostra di più32 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
Quando trattiamo con un fenomeno il cui esito non è predefinito siamo nell'ambito della teoria della probabilità Il fenomeno è descritto attraverso una variabile casuale o aleatoria (es. valore della faccia del dado lanciato) L'esito del fenomeno che ci interessa valutare è l'evento di interesse (es. valore della faccia pari a 5) Secondo l'approccio frequentista la probabilità di un evento di verificarsi è data dalla frequenza con cui questo specifico evento si può verificare rispetto al totale dei possibili eventi (es. valore 5 rispetto ai 6 possibili esiti del lancio) P[evento di interesse] = numero di casi in cui si verifica l'evento di interesse numero di possibili eventi che si possono verificare
La distribuzione di probabilità descrive il comportamento di una variabile aleatoria (VA) da un punto di vista teorico Per una VA discreta la distribuzione di probabilità specifica la probabilità della variabile di assumere ogni possibile esito Per una VA continua la distribuzione di probabilità specifica la probabilità associata a intervalli di valori Per facilitare la comprensione possiamo pensare alla distribuzione di probabilità come la frequenza relativa associata a un campione infinitamente grande
Per spiegare ulteriormente il concetto di distribuzione di probabilità consideriamo un esperimento con i dadi: Consideriamo dadi a 6 facce Quando si lancia il dado la probabilità di ottenere una qualunque delle facce è sempre pari a 1/6 Se il dado non è truccato!
Pensiamo di lanciare due dadi insieme e di considerare la somma dei valori delle due facce che escono dal lancio: + = 8 Se i dadi non sono truccati, la probabilità di avere una qualunque coppia è pari a: 1 1 = -.- 6 6 1 36 perché l'uscita di ognuno dei due dadi è indipendente dall'altra
Lanciamo i due dadi e facciamo la somma delle due facce Il valore minimo che si può ottenere è 2 ed è dato da: + La probabilità ottenere un due è 1 36 Il valore 3 è dato da: + +1 La probabilità ottenere un tre è di 1 1 2 1 + = = 36 36 36 18 di
Il valore con il maggior numero di combinazioni che lo generano è 7 Il valore 7 è dato da: 1+1 + + + ++ La probabilità di ottenere un sette è 1 + 1 - + 36 1 - + 36 36 + 36 1 - + 1 36 1 36 6 = = 36 1 6
In sintesi
| Somma delle facce | Probabilità che si verifichi |
|---|---|
| 2 | 1/. /36 |
| 3 | 2 / 36 |
| 4 | 3 3/36 |
| 5 | 4/36 36 |
| 6 | 5 5/36 36 |
| 7 | 6 6/36 36 |
| 8 | 5/ 36 |
| 9 | 4 / 36 |
| 10 | 3 ◌ൗ 36 |
| 11 | 2/36 36 |
| 12 | 1/ 36 |
Distribuzione di probabilità della somma dei due dadi 0,18 0,16 0,14 0,12 0,10 0,08 0,06 0,04 0,02 0,00 2 3 4 5 6 7 8 9 10 11 12 La tabella e il grafico esprimono la distribuzione di probabilità della somma delle facce di due dadi La somma di queste probabilità è pari a 1 poiche nel lancio dei dadi si verificherà certamente uno di questi valori
Quanto detto fino a ora vale da un punto di vista teorico. Potremmo provare a eseguire un esperimento lanciando più volte i due dadi e tenendo nota della somma delle facce Usiamo uno strumento che simula il lancio di due dadi: http://www.ariehbennaim.com/simulations/simulation7.htm
«Lanciamo» i due dadi 20 volte
| Sum | Occurance | Combinations | Probabili|| Graph |
|---|---|---|---|
| 2 | 1 | 1/36 | |
| 3 | 1 | 2 | 2/36 I |
| 4 | 3 | 3/36 | |
| 5 | 4 | 4 | 4/36 |
| 6 | 6 | 5 | 5/36 |
| 7 | 1 | 6 | 6/36 |
| 8 | 3 | 5 | 5/36 |
| 9 | 4 | 4 | 4/36 |
| 10 | 1 | 3 | 3/36 I |
| 11 | 2 | 2/36 | |
| 12 | 1 | 1/36 |
Distribuzione di frequenza del campione Distribuzione di probabilità http://www.ariehbennaim.com/simulations/simulation7.htm
«Lanciamo» i due dadi 50 volte
| Sum | Occurance | Combinations | Probability |Graph |
|---|---|---|---|
| 2 | 1 | 1/36 | |
| 3 | 2 | 2 | 2/36 |
| 4 | 3 | 3 | 3/36 |
| 5 | 8 | 4 | 4/36 |
| 6 | 8 | 5 | 5/36 |
| 7 | 9 | 6 | 6/36 |
| 8 | 11 | 5 | 5/36 |
| 9 | 4 | 4 | 4/36 |
| 10 | 2 | 3 | 3/36 I |
| 11 | 1 | 2 | 2/36 I |
| 12 | 2 | 1 | 1/36 |
http://www.ariehbennaim.com/simulations/simulation7.htm
«Lanciamo» i due dadi 100 volte
| Sum | Occurance | Combinations | Probability | Graph |
|---|---|---|---|---|
| 2 | 3 | 1 | 1/36 | I |
| 3 | 4 | 2 | 2/36 | |
| 4 | 9 | 3 | 3/36 | |
| 5 | 10 | 4 | 4/36 | |
| 6 | 16 | 5 | 5/36 | |
| 7 | 19 | 6 | 6/36 | |
| 8 | 12 | 5 | 5/36 | |
| 9 | 6 | 4 | 4/36 | |
| 10 | 10 | 3 | 3/36 | |
| 11 | 9 | 2 | 2/36 | |
| 12 | 2 | 1 | 1/36 | I |
http://www.ariehbennaim.com/simulations/simulation7.htm
«Lanciamo» i due dadi 1000 volte
| Sum | Occurance | Combinations | Probability | Graph |
|---|---|---|---|---|
| 2 | 30 | 1 | 1/36 | |
| 3 | 60 | 2 | 2/36 | |
| 4 | 76 | 3 | 3/36 | |
| 5 | 114 | 4 | 4/36 | |
| 6 | 134 | 5 | 5/36 | |
| 7 | 181 | 6 | 6/36 | |
| 8 | 129 | 5 | 5/36 | |
| 9 | 100 | 4 | 4/36 | |
| 10 | 94 | 3 | 3/36 | |
| 11 | 61 | 2 | 2/36 | |
| 12 | 21 | 1 | 1/36 |
http://www.ariehbennaim.com/simulations/simulation7.htm
Al crescere del numero di lanci la distribuzione di frequenza calcolata sul campione si avvicina sempre di più alla distribuzione di probabilità teorica (leggi dei grandi numeri)
Graph Graph Graph Graph I I I I
Distribuzione di probabilità della somma dei due dadi 0,18 0,16 0,14 0,12 0,10 0,08 0,06 0,04 0,02 0,00 2 3 4 5 6 7 8 9 10 11 12
| Sum | Occurance | Probability |
|---|---|---|
| 2 | 30 | 0,03 0,03 1/36 |
| 3 | 60 | 0,06 0,06 2/36 |
| 4 | 76 | 0,08 0,08 3/36 |
| 5 | 114 | 0,11 0,11 4/36 |
| 6 | 134 | 0,13 0,14 5/36 |
| 7 | 181 | 0,18 0,17 6/36 |
| 8 | 129 | 0,13 0,14 5/36 |
| 9 | 100 | 0,10 0,11 4/36 |
| 10 | 94 | 0,09 0,08 3/36 |
| 11 | 61 | 0,06 0,06 2/36 |
| 12 | 21 | 0,02 0,03 1/36 |
Graph
Distribuzione di probabilità della somma dei due dadi 0,18 0,16 0,14 0,12 0,10 0,08 0,06 0,04 0,02 0,00 2 3 4 5 6 7 8 9 10 11 12
Abbiamo visto un esempio di come la distribuzione di frequenza tende alla distribuzione di probabilità teorica, quando questa ben descrive il fenomeno oggetto di studio Quindi il fenomeno di interesse è rappresentato attraverso una variabile aleatoria, per la quale si assume una data distribuzione di probabilità.
In molti casi possiamo descrivere una distribuzione di probabilità con un grafico e possiamo specificarla attraverso una formula matematica Possiamo anche specificarla attraverso: - una misura di tendenza centrale: media della popolazione (o valore atteso) - una misura di dispersione: varianza della popolazione, deviazione standard della popolazione Nel caso di variabili aleatorie discrete si calcolano con modalità simili al calcolo della media e della devizione standard campionarie
Situazione reale relazione Impianto teorico Fenomeno reale descritto attraverso Variabile aleatoria Campione sottoinsieme osservato Popolazione Distribuzione di frequenza Media del campione Varianza del campione «tende» a Distribuzione di probabilità teorica Media della popolazione teorica o valore atteso stime Varianza della popolazione
Esistono molte distribuzioni di probabilità teoriche che possono essere utilizzate per descrivere fenomeni reali. Alcune distribuzioni di probabilità teoriche sono associabili a variabili aleatorie discrete altre a variabili aleatorie continue Due distribuzioni di probabilità teoriche adatte a descrivere il comportamento di variabili aleatorie di tipo discreto sono: - la distribuzione bernoulliana - la distribuzione binomiale Per variabili aleatorie di tipo continuo è molto utilizzata la distribuzione normale (o gaussiana)
Si usa per descrivere fenomeni che possono avere solo due esiti mutuamente esclusivi come: - lancio di una moneta (testa o croce) - stato di salute o malattia (malato o sano) - stato in vita del paziente al momento dell'osservazione (morto o vivo ) Consideriamo quindi Y una variabile aleatoria (v.a.) che può assumere solo due valori mutuamente esclusivi (dicotomica) Per semplicità indichiamo i due esiti come 1 e 0 - lancio di una moneta (1=testa e 0=croce) - stato di salute o malattia (1=malato e 0=sano) - stato in vita del paziente al momento dell'osservazione (1=morto e 0= vivo )
La distribuzione di Bernoulli Indichiamo con p la probabilità che Y sia =1 Di conseguenza la probabilità che Y sia =0 è 1-p Allora possiamo assumere per Y la distribuzione di probabilità di Bernoulli con probabilità p Y ~ Bernoulli (p) p è l'unico parametro che serve per specificare completamente questa distribuzione di probabilità
La distribuzione di Bernoulli - esempio Sia Y una variabile casuale che rappresenta, ad esempio, il comportamento nei confronti del fumo; Y = 1 se un adulto è un fumatore e Y = 0 se non lo è. I due risultati di Y sono mutuamente esclusivi ed esaustivi. Nel 1987, il 29% degli adulti negli Stati Uniti fumava si- garette, sigari o pipa (2); pertanto, possiamo quantizzare le probabilità relative ai rispettivi risultati di Y come: P(Y = 1) = p =0,29 e P(Y=0)= 1 - p = 1,00 - 0,29 =0,71. Attenzione: in questo esempio stiamo supponendo che 0.29 sia il vero valore di p Pagano, Gauvreau - Biostatistica - GG Idelson Gnocchi
La distribuzione di Bernoulli La media di popolazione della distribuzione di Bernoulli è pari a p 1 . p + 0 . (1 - p) = p La varianza di popolazione della distribuzione di Bernulli è pari a p · (1 - p) (1-p)2.p+(0-p)2.(1-p) = (1 - p)2 . p + p2 . (1-p) = (1-2 . p+p2) . p+p2 -p3 = p-2 . p2 + p3 + p2 - p3 = p -p2 = p . (1 - p) La deviazione standard di popolazione della distribuzione di Bernulli è pari a _p . (1 - p)
La distribuzione di Bernoulli Nell'esempio dei fumatori: - la media di popolazione è pari a p = 0.29 - la varianza di popolazione è pari a p . (1 - p) = 0.29 . 0.71 = 0.2059 - la deviazione standard di popolazione è pari a p . (1 -p) = V0. 2059 = 0.0424
È utile a descrivere fenomeni come: - Numero di fratelli che erediterà un tratto genetico - Numero di pazienti che presenterà effetti indesiderati a un'esposizione ambientale in un campione estratto da una popolazione - Numero di persone con una data malattia in un campione estratto da una popolazione La distribuzione di binomiale si introduce a partire dalla distribuzione Bernuolli
La distribuzione binomiale Supponiamo di selezionare casualmente due soggetti dalla popolazione adulta degli Stati Uniti. Se introduciamo una nuova varia- bile casuale X che rappresenta il numero di soggetti nella coppia che sono fumatori, al- lora X può assumere tre possibili valori: 0, 1 o 2. O entrambi i soggetti selezionati non fu- mano, o uno fuma e l'altro no, o entrambi sono fumatori.
| Risultato di Y | |||
|---|---|---|---|
| Primo soggetto | Secondo soggetto | Probabilità di questi risultati | Numero di fumatori X |
| 0 | 0 | (1 - p) (1 - p) | 0 |
| 1 | 0 | p(1 - p) | 1 |
| 0 | 1 | (1 - p)p | 1 |
| 1 | 1 | PP | 2 |
Pagano, Gauvreau - Biostatistica - GG Idelson Gnocchi
La distribuzione binomiale
| Risultato di Y | |||
|---|---|---|---|
| Primo soggetto | Secondo soggetto | Probabilità di questi risultati | Numero di fumatori X |
| 0 | 0 | (1 - p) (1 - p) | 0 |
| 1 | 0 | p(1 - p) | 1 |
| 0 | 1 | (1 - p)p | 1 |
| 1 | 1 | PP | 2 |
Avendo assunto p=0.29 la probabilità che: · nessuno dei due soggetti fumi è pari a (1 - 0.29) . (1 - 0.29) = 0,5041 · solo uno dei due soggetti fumi è pari a 2 . 0.29 . (1 - 0.29) = 0,4118 · entrami i soggetti fumino è pari a 0.29 · 0.29 = 0,0841 Pagano, Gauvreau - Biostatistica - GG Idelson Gnocchi