Statistica: Curva normale e intervalli di confidenza con casi studio

Documento da Università su Statistica, Lezione 8, 16/05/2024. Il Pdf presenta casi studio ed esempi pratici sull'applicazione della curva normale e la derivazione degli intervalli di confidenza, utile per lo studio della Matematica a livello universitario.

See more

12 Pages

1
Statistica, Lezione 8, 16/05/2024
Prof. Danila Azzolina
CASI STUDIO
Oggi vediamo di fare qualcosa di più pratico, degli esercizi sulla normale, per quanto riguarda il recupero delle due
ore mancanti, per tempi stretti, non riusciamo a recuperarle, vi caricherò del materiale addizionale sull’intervallo di
confidenza che sono dei cenni di statistica differenziale che poi ovviamente NON VI CHIEDERÒ ALL’ESAME.
Vediamo di finalizzare degli esempi sull’applicazione dell’utilizzo della curva normale a campi biometrici o meno.
Ad esempio, questo studio che vi mostro riguarda un ambito non proprio medico, però più o meno rende l’idea.
ESEMPIO 1
Vediamo come funziona:
I diametri del tronco di alcuni
arbusti vediamo siano distribuiti
come una normale, con media 8 e
deviazione standard di 2. La
probabilità per un arbusto di avere
un tronco con un diametro
eccezionalmente grande
(maggiore di 12cm) è pari a?
Quindi sotto viene fatto vedere
come si passa dalla normale alla normale standard e si determinano le aree sottese alla curva per risolvere
questo problema.
Facciamo insieme tutti i passaggi in maniera che sia più chiaro visivamente.
Allora, quando fate un esercizio di questo tipo vi conviene disegnare il problema e tenere sempre presente qual
è la media del fenomeno: con media 8 e deviazione standard, quindi varianza 4.
Quindi la vostra variabile di interesse sarà fatta nel seguente modo: avrete la vostra variabile casuale normale,
che è centrata su 8 (la media) e dovete cercare di capire qual è la probabilità di osservare un valore superiore
di 12. Quindi graficamente l’area sottesa alla curva. Questo è il nostro fenomeno di interesse.
Quando si parte da una variabile casuale qualunque sia il fenomeno si denota con la lettera maiuscola.
In particolare, se ci riferiamo ad una curva normale: X si distribuisce come una normale N con media 8 e si
scrive la varianza di 4.
L’obiettivo è trovare la probabilità che il diametro del tronco sia maggiore di 12.
Qui bisognerebbe fare l’integrale ma noi non lo facciamo perché ci aiutano le tavole della normale.
Tuttavia, dobbiamo fare una traslazione dalla normale alla normale standard.
Vi ricordo che la standardizzazione è quella procedura che vi pulisce la variabile dall’unità di misura.
Una normale standardizzata ha media 0 e varianza 1. Quindi in corrispondenza dell’8 abbiamo un valore di 0
e dovete cercare il target percentile che su scala standardizzata corrisponde a 12, chiamiamolo zeta-minimo.
2
Questa curva si distribuisce come una z, una normale standardizzata, e anche qui la variabile segue una normale
standardizzata ma con media 0 e
varianza 1.
Adesso dobbiamo cercare di capire
come ricercare questa probabilità nelle
tavole della normale standard. Quindi
ci basta scriverla come probabilità che
X (standardizzazione) - mu / sigma
(relazione standard) (questa è una Z)
sia maggiore di (Allora dobbiamo
standardizzare il valore di riferimento
questo 12) … quindi 12-8/(deviazione standard) 2= 2; quindi questo è uguale alla probabilità che Z>2.
Ora so che questo valore di 12 standardizzato corrisponde a 2, quindi cerco sulle tavole della normale l’area
sottesa alla curva a destra del valore due.
Quindi come mi comporto? In realtà non esiste una sola strategia, vediamone più di una:
Nelle slide è riportata la soluzione sempre in forma canonica, usando la probabilità cumulativa.
Tuttavia, voi avete le slide e le tavole potete usare anche la colonna B.
Vi ricordò com’è fatta la tavola della normale:
Sulla prima colonna avete i valori (z) = valori standardizzati che nel nostro caso è 2.
Quindi il nostro problema graficamente è quello di andare a ricavare l’area alla destra del valore due, quindi
la probabilità di osservare un valore maggiore di due.
Vi conviene andarlo a cercare in colonna B, voi cercate il valore 2 e in colonna B osservate il valore su scala
standardizzato maggiore di due che è 0,0228, quindi significa che ha un circa 2,3% di probabilità di trovare un
diametro del tronco particolarmente grande.
Questa probabilità è quindi uguale a 0, 0228. Tuttavia, non è l’unica soluzione, se voi ci fate caso nella slide
precedente il problema è risolto usando la prima colonna, cumulativa, ovvero la probabilità di osservare un
valore più piccolo di due, quindi fa il complemento a 1 ovvero : 1 (tutta l’area sottesa alla curva) - (probabilità
di osservare un valore più piccolo di 2) = area corrispondente alla colonna B per differenza.
Il risultato sarà lo stesso (svolge i calcoli spiegando che z<2 non è altro che la cumula).
Se scegliete questa soluzione, che non conviene, allora andate a vedere sulla colonna A che dà la cumulativa
e cercate in corrispondenza del percentile 2 il valore 0.9772.
1-0.9772=0.228
Il modo per non confondervi è quello di visualizzarlo graficamente, bisogna vedere l’area di interesse in base
alla situazione e scegliere la colonna.
ESEMPIO 2
Ora vediamo un altro esempio: la pressione vascolare cerebrale

Unlock the full PDF for free

Sign up to get full access to the document and start transforming it with AI.

Preview

Statistica: Esercizi sulla Curva Normale

Statistica, Lezione 8, 16/05/2024 Prof. Danila Azzolina

Casi Studio e Recupero Lezioni

Oggi vediamo di fare qualcosa di più pratico, degli esercizi sulla normale, per quanto riguarda il recupero delle due ore mancanti, per tempi stretti, non riusciamo a recuperarle, vi caricherò del materiale addizionale sull'intervallo di confidenza che sono dei cenni di statistica differenziale che poi ovviamente NON VI CHIEDERÒ ALL'ESAME. Vediamo di finalizzare degli esempi sull'applicazione dell'utilizzo della curva normale a campi biometrici o meno. Ad esempio, questo studio che vi mostro riguarda un ambito non proprio medico, però più o meno rende l'idea.

Esempio 1: Diametri del Tronco

Caso di studio: diametri del tronco Si supponga che i diametri del tronco di alcuni arbusti siano distribuiti normalmente con media 8 cm e deviazione standard 2 cm. La probabilità per un arbusto di avere un tronco con diametro eccezionalmente grande (> 12cm) è pari a: P(X > 12) =1-P |Z <- -P Z < 12 - 8) = 12-8 =1-+[2,0]=1-0,977 =0,023.

Funzionamento e Passaggi

Vediamo come funziona: I diametri del tronco di alcuni arbusti vediamo siano distribuiti come una normale, con media 8 e deviazione standard di 2. La probabilità per un arbusto di avere un tronco con un diametro eccezionalmente grande (maggiore di 12cm) è pari a? Quindi sotto viene fatto vedere come si passa dalla normale alla normale standard e si determinano le aree sottese alla curva per risolvere questo problema. Facciamo insieme tutti i passaggi in maniera che sia più chiaro visivamente.

Impostazione dell'Esercizio

Allora, quando fate un esercizio di questo tipo vi conviene disegnare il problema e tenere sempre presente qual è la media del fenomeno: con media 8 e deviazione standard, quindi varianza 4. Quindi la vostra variabile di interesse sarà fatta nel seguente modo: avrete la vostra variabile casuale normale, che è centrata su 8 (la media) e dovete cercare di capire qual è la probabilità di osservare un valore superiore di 12. Quindi graficamente l'area sottesa alla curva. Questo è il nostro fenomeno di interesse. Quando si parte da una variabile casuale qualunque sia il fenomeno si denota con la lettera maiuscola. In particolare, se ci riferiamo ad una curva normale: X si distribuisce come una normale N con media 8 e si scrive la varianza di 4. L'obiettivo è trovare la probabilità che il diametro del tronco sia maggiore di 12. Qui bisognerebbe fare l'integrale ma noi non lo facciamo perché ci aiutano le tavole della normale. Tuttavia, dobbiamo fare una traslazione dalla normale alla normale standard. Vi ricordo che la standardizzazione è quella procedura che vi pulisce la variabile dall'unità di misura. Una normale standardizzata ha media 0 e varianza 1. Quindi in corrispondenza dell'8 abbiamo un valore di 0 e dovete cercare il target percentile che su scala standardizzata corrisponde a 12, chiamiamolo zeta-minimo.

Standardizzazione e Ricerca nelle Tavole

1Questa curva si distribuisce come una z, una normale standardizzata, e anche qui la variabile segue una normale Caso di studio: pressione vascolare cerebrale standardizzata ma con media 0 e varianza 1. Nella popolazione generale la pressione vascolare cerebrale CBF è distribuita con media 75 e deviazione standard 17. Un paziente è definito a rischio di ictus se ha una CBF < 40. Adesso dobbiamo cercare di capire come ricercare questa probabilità nelle tavole della normale standard. Quindi La probabilità di essere a rischio è pari a: ci basta scriverla come probabilità che ) =P( z < 40-75)- = >[-2,06] =1-+[2,06] = 1-0,9803 = 0,020 X (standardizzazione) - mu / sigma (relazione standard) (questa è una Z) sia maggiore di ... (Allora dobbiamo standardizzare il valore di riferimento questo 12) ... quindi 12-8/(deviazione standard) 2= 2; quindi questo è uguale alla probabilità che Z>2. Ora so che questo valore di 12 standardizzato corrisponde a 2, quindi cerco sulle tavole della normale l'area sottesa alla curva a destra del valore due. Quindi come mi comporto? In realtà non esiste una sola strategia, vediamone più di una:

Strategie di Soluzione

Nelle slide è riportata la soluzione sempre in forma canonica, usando la probabilità cumulativa. Tuttavia, voi avete le slide e le tavole potete usare anche la colonna B. Vi ricordò com'è fatta la tavola della normale:

  • Sulla prima colonna avete i valori (z) = valori standardizzati che nel nostro caso è 2.

Quindi il nostro problema graficamente è quello di andare a ricavare l'area alla destra del valore due, quindi la probabilità di osservare un valore maggiore di due. Vi conviene andarlo a cercare in colonna B, voi cercate il valore 2 e in colonna B osservate il valore su scala standardizzato maggiore di due che è 0,0228, quindi significa che ha un circa 2,3% di probabilità di trovare un diametro del tronco particolarmente grande. Questa probabilità è quindi uguale a 0, 0228. Tuttavia, non è l'unica soluzione, se voi ci fate caso nella slide precedente il problema è risolto usando la prima colonna, cumulativa, ovvero la probabilità di osservare un valore più piccolo di due, quindi fa il complemento a 1 ovvero : 1 (tutta l'area sottesa alla curva) - (probabilità di osservare un valore più piccolo di 2) = area corrispondente alla colonna B per differenza. Il risultato sarà lo stesso (svolge i calcoli spiegando che z<2 non è altro che la cumula). Se scegliete questa soluzione, che non conviene, allora andate a vedere sulla colonna A che dà la cumulativa e cercate in corrispondenza del percentile 2 il valore 0.9772. 1-0.9772=0.228 Il modo per non confondervi è quello di visualizzarlo graficamente, bisogna vedere l'area di interesse in base alla situazione e scegliere la colonna.

Esempio 2: Pressione Vascolare Cerebrale

ESEMPIO 2 Ora vediamo un altro esempio: la pressione vascolare cerebrale 2Tale pressione nella popolazione (CDF) è distribuita come la normale con media 75 e deviazione standard di 17. Un paziente è a rischio di ictus se ha una CDF<40, quindi voglio capire qual è la frazione di soggetti che potenzialmente potrebbe avere una CDF pericolosa che porterebbe al rischio di sviluppare ictus. Per fare ciò si procede come prima:

Risoluzione del Problema

allora anche qui disegnatevi sempre il problema, la vostra variabile di interesse ha media 75 e deviazione standard 17. Il vostro obiettivo è quello di andare a determinare la probabilità che la CDF sia particolarmente piccola <40. Se questo esercizio si risolve meccanicamente si rischia di sbagliare perché 40 è alla sinistra della media. Siamo a sinistra della media, quindi se standardizzate il valore di 40 sarà negativo, ma noi sfruttiamo la proprietà di simmetria della normale. Quindi a 40 corrisponderà un percentile: 40 - 75 (la media) / 17 (lo scarto)= 2,06 ; dunque, a questo punto si trova la probabilità che z sia inferiore di -2.06. Le tavole della normale riportano, sfruttando la proprietà di simmetria, solo le aree sottese in riferimento ai valori positivi, perché sappiamo che la probabilità di osservare un valore più piccolo di -2.06 è uguale alla probabilità di osservare un valore più grande di 2.06; quindi mi basta fare riferimento al valore assoluto per determinare l'area sottesa alla curva. In questo caso conviene risolvere il problema nella colonna B, voi trovate direttamente la probabilità che z sia maggiore di 2,06 e quest'area corrisponde a quella che z sia inferiore di 2.06. È dunque simmetrica, per risolvere il problema ci basta cercare sulle tavole della normale il percentile associato, che è di 2.06. Andiamo sule tavole e cerchiamo 2.06 nella colonna B e abbiamo direttamente la probabilità di 0.0197. Praticamente il 2%, circa, della popolazione è da tenere sotto controllo perché a rischio di ictus. Il problema può essere esteso anche nei cosiddetti range di normalità, per la quale non si intende curva normale, ma non patologico.

Esempio 3: Glaucoma e Pressione Intraoculare

ESEMPIO 3 Caso di studio: glaucoma Il glaucoma è una malattia che si presenta con una pressione intraoculare eccessiva. Nella popolazione generale, la pressione intraoculare è normale con media 16 mmHg e deviazione standard 3 mmHg. Se il range di normalità è tra i 12 ed i 20 mm Hg, la probabilità di essere normali è pari a: P(12<X<20)=p12-16<z<20-16)= = [1,33]-[-1,33] = >[1,33]-(1-[1,33]) = 2x[1,33]-1=0,818. Ora spiego meglio, in pratica c'è un caso studio come quello del glaucoma, che è una malattia che si presenta con una pressione intraoculare eccessiva. Nella popolazione generale la pressione intraoculare è normale, ovvero si distribuisce secondo una curva gaussiana normale, con pressione di media 16mmHg e deviazione standard di 3.

Range di Normalità e Probabilità

3Se il range di normalità (intesa come assenza di patologia) è tra 12 e 20 mmHg, la probabilità di essere non patologici in merito alla pressione intraoculare sarà pari a? Quindi il paziente dal punto di vista della pressione intraoculare sta bene se i valori rientrano nel range. A questo punto si procede come prima, anche qui basta disegnare il problema, avete il fenomeno di interesse che è la pressione intraoculare con una media di 16 e volete capire qual è la probabilità che la pressione sia compresa tra 12 e 20. Graficamente si valuta l'area sottesa alla curva e si trova con pochi passaggi in più rispetto a prima.

Calcolo della Probabilità

Caso di studio: glaucoma II f(x) Pr(12 ≤X ≤20) Area in the original scale = 81.6% 0 12 16 20 x f(z Pr(-1.33 ≤ Z ≤1.33) Equivalent area in the standardized scale = 81.6% -1.33 0 1.33 L'obiettivo è di stimare la probabilità che la pressione oculare sia compresa tra 12 e 20. A questo punto vediamo la traslazione dalla normale alla normale standardizzata traslando la variabile a z, la faccio diventare z. Abbiamo i due percentili che corrispondono a 12 e 20, z1 e z2. Si determina l'area: tale probabilità corrisponde alla probabilità che z sia tra (quindi standardizzo) 12-16/3 (la deviazione standard) =- 1.33 e poi con l'altro valore 20-16/3=1.33 ... un caso fortunato. A questo punto abbiamo la probabilità che z sia compresa tra -1.33 e 1.33. Dunque, come potrebbe essere risolto questo esercizio?

Diverse Soluzioni

In realtà esistono più soluzioni, potrei guardare la colonna D che dà direttamente la probabilità di osservare un valore da +/-1,33 , basta cercare questo valore e prendere in colonna D il valore associato che è 0.8165. Anche se questa è la soluzione più semplice, ma non l'unica, anche perché non sempre z1 e z2 coincidono in valore assoluto. Altra soluzione, con il modo canonico, è usare la probabilità cumulativa, quindi con un semplice passaggio in più con la colonna A. Quindi la probabilità di osservare un valore più piccolo di 1.33 meno la probabilità di osservare un numero più piccolo di (-1.33), tuttavia le tavole della normale riportano solo i valori positivi: nella colonna A si trova il valore positivo e nella colonna B quello negativo, però nelle slides risolve tutto con la cumulativa, dice che la probabilità di osservare un valore minore di -1.33 è il complemento a 1 rispetto alla probabilità di osservare un numero più piccolo di 1.33. In pratica è come dire che l'area è uguale a 1 (tutta l'area sottesa alla curva) meno l'area che va da 1.33 a meno infinito. Nelle slides la strada è più lunga, usando il modo canonico. Quindi significa che l'82% della popolazione ha una situazione regolare dal punto di vista della pressione intraoculare. Quindi gli esercizi sulla normale funzionano in questo modo. L'approssimazione della normale alla binomiale non la facciamo tutta. 4

Can’t find what you’re looking for?

Explore more topics in the Algor library or create your own materials with AI.