Elementi di Calcolo delle Probabilità: variabili aleatorie e valori attesi

Documento di Appunti universitari sul Calcolo delle Probabilità. Il Pdf, utile per studenti di Matematica, spiega le variabili aleatorie discrete e continue, la distribuzione di probabilità, la funzione di densità e il valore atteso, con esempi pratici.

Mostra di più

11 pagine

1. VARIABILI ALEATORIE

Introduciamo in questa sezione il concetto di variabile aleatoria, presentando dap-

prima alcuni semplici esempi.

Una scatola contiene 10 palline, 3 delle quali rosse e le restanti verdi. Supponiamo

di estrarre dalla scatola, in successione e con reimmissione, 4 palline. Il numero X delle

palline verdi estratte `e aleatorio, ed i suoi valori possibili sono ovviamente gli elementi

dell’insieme {0, 1, 2, 3, 4}; a priori, per`o, non siamo in grado di dire quanto vale X, in

quanto il suo valore dipende dall’esito dell’esperimento eﬀettuato (le 4 estrazioni). Per

questo motivo X `e chiamata variabile aleatoria. Se, ad esempio, l’esito dell’esperimento

`e V V RV (cio`e prime 2 palline e quarta pallina estratte verdi, terza pallina estratta

rossa), X vale 3, stesso valore che assume se l’esito `e una qualunque altra combinazione

di 3 palline verdi ed una rossa, indipendentemente dall’ordine. Fissato un qualunque

insieme di numeri reali B, indicheremo con {X ∈ B} l’evento che `e vero se il valore

di X appartiene all’insieme B. Ad esempio, l’evento {X ∈ {2, 3}} `e l’evento vero se

il numero di palline verdi estratte `e pari a 2 o a 3, cos`ı come l’evento {X > 2} `e

l’evento vero se il numero di palline verdi estratte `e maggiore di 2. Considerata una

variabile aleatoria X, l’insieme di tutte le probabilit`a degli eventi {X ∈ B} costituisce

la cosiddetta distribuzione di probabilit`a di X.

Come secondo esempio si consideri il seguente gioco a premi, per prendere parte al

quale si pagano 7 rubli; il gioco consiste nel lanciare 2 dadi e la somma dei risultati

dei due dadi rappresenta la vincita. Il guadagno (in senso lato, positivo o negativo)

netto nel gioco `e, dunque, la diﬀerenza tra tale somma e 7. Indichiamo con Y tale

quantit`a che `e, naturalmente, una variabile aleatoria, dal momento che il suo valore

dipende dall’esito dell’esperimento consistente nel lanciare i 2 dadi. Se, ad esempio,

l’esito dell’esperimento `e (2, 6) (ovvero, primo dado uguale a 2 e secondo dado uguale

ELEMENTI DI CALCOLO DELLE PROBABILITA'

a 6), Y assume valore 1, mentre se l’esito `e (1, 1) Y `e uguale a -5. La distribuzione

di probabilit`a della variabile aleatoria Y `e data dall’insieme di tutte le probabilit`a

degli eventi {Y ∈ B}; poich`e Y pu`o assumere, come valori possibili, tutti gli interi

da -5 a 5, la distribuzione di probabilit`a di Y `e completamente determinata dai valori

P (Y = −5), P (Y = −4), . . . , P (Y = 5) (che naturalmente hanno somma uguale a 1).

Come ultimo esempio, la quotazione di un titolo in una futura seduta di borsa ´e,

in generale, una variabile aleatoria.

In situazioni come queste, ma ovviamente anche molto piu’ complesse di queste, e’

quindi importante calcolare la probabilita’ con cui si veriﬁcano gli eventi relativi alla

variabile aleatoria di interesse X, cio`e P (X ∈ B), dove B ´e un sottoinsieme di <.

Le variabili aleatorie considerate nei primi due esempi precedenti (numero di palline

verdi estratte e guadagno ottenuto nel gioco) sono dette discrete, in quanto l’insieme

dei valori possibili per esse e’ ﬁnito (`e chiamata discreta anche una variabile aleatoria

per cui l’insieme dei valori possibili e’ inﬁnito numerabile).

Per calcolare le probabilit´a di eventi relativi ad una variabile aleatoria discreta X

(cio´e per descriverne la distribuzione di probabilit´a) ´e suﬃciente assegnare, per ciascun

numero reale x, la probabilit´a con cui X assume tale valore. Si pu´o quindi introdurre

una funzione reale di variabile reale p

deﬁnita come segue

(x) = P (X = x);

la probabilit´a di un qualunque evento del tipo {X ∈ B} si otterr´a semplicemente som-

mando i valori di p

(x) per tutti gli x che appartengono a B. Possiamo pensare a

questa funzione (che ´e chiamata funzione di probabilit´a) come ad un modello matem-

atico (in certi casi ovvio, in altri meno e legato ad informazioni sul fenomeno aleatorio

coinvolto) per descrivere il comportamento di una variabile aleatoria discreta.

In molti casi (e questo ´e ci´o che avviene nel terzo esempio presentato) occorre con-

Anteprima

VARIABILI ALEATORIE

Introduciamo in questa sezione il concetto di variabile aleatoria, presentando dap- prima alcuni semplici esempi. Una scatola contiene 10 palline, 3 delle quali rosse e le restanti verdi. Supponiamo di estrarre dalla scatola, in successione e con reimmissione, 4 palline. Il numero X delle palline verdi estratte è aleatorio, ed i suoi valori possibili sono ovviamente gli elementi dell'insieme {0, 1,2,3,4}; a priori, però, non siamo in grado di dire quanto vale X, in quanto il suo valore dipende dall'esito dell'esperimento effettuato (le 4 estrazioni). Per questo motivo X è chiamata variabile aleatoria. Se, ad esempio, l'esito dell'esperimento è VVRV (cioè prime 2 palline e quarta pallina estratte verdi, terza pallina estratta rossa), X vale 3, stesso valore che assume se l'esito è una qualunque altra combinazione di 3 palline verdi ed una rossa, indipendentemente dall'ordine. Fissato un qualunque insieme di numeri reali B, indicheremo con {X E B} l'evento che è vero se il valore di X appartiene all'insieme B. Ad esempio, l'evento {X € {2,3}} è l'evento vero se il numero di palline verdi estratte è pari a 2 o a 3, così come l'evento {X > 2} è l'evento vero se il numero di palline verdi estratte è maggiore di 2. Considerata una variabile aleatoria X, l'insieme di tutte le probabilità degli eventi {X € B} costituisce la cosiddetta distribuzione di probabilità di X.

Come secondo esempio si consideri il seguente gioco a premi, per prendere parte al quale si pagano 7 rubli; il gioco consiste nel lanciare 2 dadi e la somma dei risultati dei due dadi rappresenta la vincita. Il guadagno (in senso lato, positivo o negativo) netto nel gioco è, dunque, la differenza tra tale somma e 7. Indichiamo con Y tale quantità che è, naturalmente, una variabile aleatoria, dal momento che il suo valore dipende dall'esito dell'esperimento consistente nel lanciare i 2 dadi. Se, ad esempio, l'esito dell'esperimento è (2,6) (ovvero, primo dado uguale a 2 e secondo dado uguale 1a 6), Y assume valore 1, mentre se l'esito è (1,1) Y è uguale a -5. La distribuzione di probabilità della variabile aleatoria Y è data dall'insieme di tutte le probabilità degli eventi {Y € B}; poichè Y può assumere, come valori possibili, tutti gli interi da -5 a 5, la distribuzione di probabilità di Y è completamente determinata dai valori P(Y = - 5), P(Y = - 4), ... , P(Y = 5) (che naturalmente hanno somma uguale a 1). Come ultimo esempio, la quotazione di un titolo in una futura seduta di borsa é, in generale, una variabile aleatoria.

In situazioni come queste, ma ovviamente anche molto piu' complesse di queste, e' quindi importante calcolare la probabilita' con cui si verificano gli eventi relativi alla variabile aleatoria di interesse X, cioè P(X E B), dove B é un sottoinsieme di R. Le variabili aleatorie considerate nei primi due esempi precedenti (numero di palline verdi estratte e guadagno ottenuto nel gioco) sono dette discrete, in quanto l'insieme dei valori possibili per esse e' finito (è chiamata discreta anche una variabile aleatoria per cui l'insieme dei valori possibili e' infinito numerabile).

Per calcolare le probabilitá di eventi relativi ad una variabile aleatoria discreta cioé per descriverne la distribuzione di probabilitá) é sufficiente assegnare, per ciascun numero reale x, la probabilitá con cui X assume tale valore. Si puó quindi introdurre una funzione reale di variabile reale px definita come segue Px (x)= P(X = x la probabilitá di un qualunque evento del tipo {X € B} si otterrá semplicemente som- mando i valori di px (x) per tutti gli x che appartengono a B. Possiamo pensare a questa funzione (che é chiamata funzione di probabilitá) come ad un modello matem- atico (in certi casi ovvio, in altri meno e legato ad informazioni sul fenomeno aleatorio coinvolto) per descrivere il comportamento di una variabile aleatoria discreta.

In molti casi (e questo é ció che avviene nel terzo esempio presentato) occorre con- 2siderare variabili aleatorie che, almeno in linea teorica, possono assumere tutti i valori di un intervallo (eventualmente illimitato) di numeri reali; quindi, variabili per le quali l'insieme dei valori possibili non e' finito (e neanche numerabilmente infinito). Ad esempio, il tempo X di durata di una lampadina e' una variabile aleatoria, ma non discreta poiche', almeno teoricamente, i valori che puo' assumere sono tutti i numeri reali non negativi (quindi, gli elementi dell'intervallo [0, +o)). Allo stesso modo, la statura Y di un individuo estratto a caso da un gruppo di persone e' una variabile aleatoria non discreta, poiche' in linea teorica la statura puo' essere un numero reale positivo qualunque (entro determinati limiti inferiore e superiore).

Anche di eventi relativi a variabili aleatorie di questo tipo e' ovviamente fondamen- tale calcolare le probabilita'; ad esempio, si deve poter calcolare la probabilita' che la lampadina abbia durata superiore ad una certa soglia (cioe' la probabilita' dell'evento {X > k}), oppure la probabilita' dell'evento {165 < Y < 175}, di ovvio significato. In generale, deve essere possibile determinare anche per una variabile aleatoria X non discreta la distribuzione di probabilitá, ovvero le probabilitá degli eventi {X € B}, con B sottoinsieme di A. Come fare per calcolare queste probabilita'? Anche in queste situazioni, normalmente, si introducono modelli probabilistici che cercano di descrivere il fenomeno aleatorio che si sta considerando. Questi modelli assumono in questo caso la forma di funzioni di densita', ovvero funzioni reali di variabile reale (f : A >R) con le due proprieta' seguenti:

f e' sempre non negativa; ovvero, f(x) ≥ 0, per ogni x € R;
l'area compresa tra l'asse delle ascisse ed il grafico di f ha valore 1 (ovvero ___ f (x)dx = 1; precisiamo che non useremo mai in seguito strumenti del calcolo integrale).

In altri termini, una funzione di densita' e' una funzione non negativa, definita su tutto A, tale che l'area compresa tra il grafico della funzione e l'asse delle ascisse sia pari a 1.

3Ma qual é il significato di una funzione di densitá con riferimento alla variabile aleato- ria X del cui comportamento probabilistico essa rappresenta un modello? Ovvero in che modo una funzione di densitá assegna la distribuzione di probabilitá di X? Per un qualunque intervallo (a, b), con -> < a < b > too, l'area sottesa alla funzione di densitá in (a, b) descrive la probabilitá con cui X sta in (a, b). Il fatto che la funzione di densitá sia sempre non-negativa e che l'area ad essa sottesa sia complessivamente pari ad 1 garantisce che la probabilitá di un qualunque evento relativo a X non sia negativa o maggiore di uno e che la probabilitá totale sia pari a 1. Variabili aleatorie di questo tipo vengono dette variabili aleatorie continue. La distribuzione di probabilitá di una variabile aleatoria continua é quindi completamente assegnata dalla sua funzione di densitá: funzione di probabilitá e funzione di densitá hanno, sostanzialmente, lo stesso ruolo, con riferimento alle variabili aleatorie discrete la prima ed alle variabili aleatorie continue la seconda.

Particolarmente rilevante, tra le distribuzioni di probabilitá continue, é la cosiddetta distribuzione gaussiana, o normale, caratterizzata da due parametri che indicheremo con p E R e o2 > 0 rispettivamente (ed il cui significato descriveremo piú avanti); la sua densitá é f(x) = 1 σν 2π e- 202 ( x -1 ) 2 . Per indicare che una variabile aleatoria X ha distribuzione gaussiana di parametri p e o2 scriveremo X ~ N(p, o2). Ovviamente, come per ogni distribuzione continua, le probabilitá di eventi relativi ad una variabile aleatoria con distribuzione gaussiana corrispondono alle aree sottese alla funzione di densitá; nel caso in esame, peró, gli integrali necessari per calcolare tali aree non si possono ottenere in modo esplicito, in quanto non é nota una primitiva della funzione di densitá. Per effettuare tali calcoli 4sono quindi usate procedure di analisi numerica. Vedremo come il software R permette di ottenere facilmente tutte le probabilità relative a variabili aleatorie con distribuzione normale.

VALORI DI SINTESI DI UNA VARIABILE ALEATORIA

In questa sezione discutiamo di come sintetizzare una variabile aleatoria tramite alcuni indicatori che ne mettano in evidenza le caratteristiche fondamentali. Iniziamo con l'introdurre il concetto di valore atteso di una variabile aleatoria, limitandoci, nella definizione, al caso di variabili aleatorie discrete. Per variabili aleatorie continue con densità la definizione di valore atteso richiede l'utilizzo dell'integrale definito e quindi risulta diversa; il significato, l'interpretazione e le proprietà del valore atteso sono però i medesimi per variabili aleatorie discrete o continue. Il concetto di valore atteso è di fondamentale importanza non solo nella teoria delle probabilità ma anche nelle applicazioni di questa alla statistica, alle quali noi saremo particolarmente interessati.

Definizione di valore atteso

Definizione. Sia X una variabile aleatoria discreta con funzione di probabilità px. Si dice valore atteso di X la quantità E(X) = x xpx (x) La definizione di valore atteso di una variabile aleatoria discreta coincide quindi, formalmente, con quella di media aritmetica (ponderata); i pesi, in questo caso, sono le probabilità dei diversi valori che X può assumere, mentre per la media aritmetica ponderata i pesi rappresentano le frequenze delle diverse modalità del carattere.

Esempi di calcolo del valore atteso

Esempio. Consideriamo una variabile aleatoria X (discreta) con funzione di proba- 5bilità - Px(x) = 1/4 x= 1 1/2 x=4 0 altrove. 1/4 x= - 1 Si ha: E(X) = 1/4 . (-1) + 1/4 · 1 + 1/2 . 4 = 2.

Esempio. Consideriamo una variabile aleatoria X (discreta) che può assumere solo i valori 1 e 0, con probabilità rispettivamente p e 1 - p, dove p € (0,1). Si ha E(X) = 1 . p+ 0 . (1-p) =p.

Interpretazione del valore atteso

Il valore atteso di una variabile aleatoria può essere interpretato in vari modi. In primo luogo possiamo dare al valore atteso un significato per così dire descrittivo; E(X) può essere interpretato come valor medio di X, ovvero come baricentro della distribuzione di probabilità di X. Utilizzando un'analogia fisica, possiamo pensare che la distribuzione di probabilità di una variabile aleatoria assegni una distribuzione di masse; il valore atteso è allora il baricentro di questa distribuzione di masse. In altri termini, se immaginiamo una distribuzione di masse su un asse, il baricentro, e quindi il valore atteso, è quel punto (unico) che garantisce equilibrio all'asse stesso.

Al valore atteso di una variabile aleatoria si può dare un'altra interpretazione, di tipo probabilistico-statistico. Immaginiamo di replicare n volte, indipendentemente, l'esperimento che dà luogo alla variabile aleatoria X. Ad esempio, se X è il risultato del lancio di un dado regolare, immaginiamo di lanciare n volte lo stesso dado; se X è la statura di un individuo estratto a caso da un gruppo di persone, immaginiamo di estrarre con reimmissione (questo per garantire l'indipendenza tra le estrazioni) n 6

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.