Slide dall'Università del Piemonte Orientale su Statistica Medica - Lezione 7. Il Pdf si concentra sulla verifica delle ipotesi, distinguendo tra ipotesi di ricerca e statistiche, e include un esercizio pratico con risoluzione dettagliata. Il documento, adatto per il corso di laurea in Educazione Professionale, presenta gli argomenti in modo chiaro e conciso.
Mostra di più33 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
a.a. 2023-2024
Statistica Medica
Lezione 7
Prof.ssa Daniela Ferrante
Dipartimento di Medicina Traslazionale
daniela.ferrante@med.uniupo.itLa verifica di ipotesi
Le ipotesi di ricerca sono un insieme di congetture o di
supposizioni che possono essere il risultato di anni di
osservazione da parte del ricercatore e che motivano la
ricerca
Le ipotesi statistiche sono ipotesi che possono essere
formulate in modo da poter essere valutate da adeguate
tecniche statistiche.
2
PROCEDIMENTO
Formulare Ho
1
Calcolare la statistica test sui dati
Calcolare la plausibilità di Ho visti i dati
1
Conclusione
Rif Ho
Non rif Ho
5
Si è ad esempio interessati a conoscere l'età media di
una popolazione. Possiamo concludere che l'età media di
questa popolazione è diversa da 30 anni?
I dati a disposizione sono le età di un campione casuale
semplice di 10 individui; la media campionaria è pari a 27.
Si assume inoltre che la distribuzione dell'età nella
popolazione sia normale e che la varianza della
popolazione sia nota e pari a 20.
HO : p = 30
H1 : u $ 30
6
Fisso il livello di significatività a prima di eseguire il test che è
definito come la probabilità di rifiutare l'ipotesi nulla quando è
vera: a è definito errore di prima specie.
a = P(rif Ho/H))
Poiché rifiutare l'ipotesi nulla quando è vera rappresenta un
errore, dobbiamo quindi fissare un valore di a piccolo. Di solito
a viene posto uguale a 0.05. Pertanto in 5 casi su 100 si rifiuta
H0 per semplice effetto del caso anche quando H0 è vera.
7
Il ricercatore sulla base del tipo di domanda a cui deve
rispondere decide di utilizzare un test unidirezionale o
bidirezionale.
Si usa un test bidirezionale quando il rifiuto dell'ipotesi
nulla è dovuto sia a valori piccoli che a valori grandi della
statistica test.
ES.
HO : p = 30
H1 : u $ 30
alfa/2
alfa/2
zona del rifiuto
Nel test bidirezionale (test a due code) la regione di rifiuto è
divisa in due parti o due code della distribuzione della
statistica test.
8
· Si usa un test unidirezionale quando il rifiuto dell'ipotesi nulla
è causato o soltanto da valori sufficientemente piccoli o
soltanto da valori sufficientemente grandi della statistica test
ES.
HO : ( >= 30
HO : [ <= 30
H1 : p < 30
H1 : p > 30
· Un test unidirezionale è un test in cui la regione di rifiuto si
trova in una o in un'altra coda della distribuzione.
HO : ( >= 30
H1 : p < 30
Ηα: με μο
Ηα: μ> μο
α
α.
1
t
t
-ta
0
0
ta
t
Reject Ho
0
0
Reject Ho
HO : [ <= 30
H1 : [ > 30
Ηα: μέ μο
-ta
0
t
Reject Ho
0
Reject Ho
9
Quindi: Data la distribuzione della statistica test, rifiuto
l'ipotesi nulla se il valore della statistica test cade nella
regione di rifiuto, mentre non rifiuto l'ipotesi nulla se la
statistica test cade nella regione di accettazione
dell'ipotesi nulla.
· Se l'ipotesi nulla non è rifiutata si può concludere che i
dati sui quali si effettua il test statistico non forniscono
prove sufficienti per rifiutarla.
· Se invece l'ipotesi nulla viene rifiutata allora i dati
saranno compatibili con l'ipotesi alternativa H1 (ipotesi di
lavoro) che riteniamo vera dato che il test ha portato al
rifiuto dell'ipotesi nulla.
10
N.B. Con la verifica di ipotesi non arriviamo ad una
dimostrazione di un'ipotesi, ma otteniamo un'indicazione
del fatto che l'ipotesi è supportata dai dati disponibili.
· Per tornare al nostro esempio avendo formulato la nostra
ipotesi nulla e l'ipotesi alternativa
HO : [ = 30
e fissato l'errore di prima specie a=0.05
H1 : u $ 30
dobbiamo scegliere l'opportuna statistica test.
Il test in questo caso sarà di tipo bidirezionale.
12
La statistica test è una statistica che può essere
calcolata a partire dai dati del campione.
Formula generale della statistica test =
(statistica di interesse-parametro ipotizzato) / errore
standard della statistica di interesse
13
HO : 1 = 30
Η1 : μ # 30
Conosciamo la deviazione standard della popolazione
o; quindi utilizziamo come statistica test z.
Z =
x
6
Vn
0
14
Calcoliamo il valore della statistica test:
Z =
27 - 30
V20
V10
= - 2,12
0,5
0,4
0,3
La somma delle aree delle
due code è pari a 0,05
0,2
0,1
0,0
z
-4
-3,2 -2,4 -1,6 -0,8
0
0,8
1,6
2,4
3,2
4
-1,96
1,96
Il valore della statistica test cade nella regione di rifiuto
dell'ipotesi nulla quindi rifiuto HO p<0,05
15
Il valore p per un test di ipotesi è la probabilità di ottenere
quando H0 è vera, un valore della statistica del test
uguale o maggiore (nel verso appropriato che porta ad
H1) di quello realmente calcolato.
Se il valore di p è minore ad a rifiutiamo l'ipotesi nulla. Se
il valore di p è maggiore di a non rifiutiamo l'ipotesi nulla
16
In generale quindi se il valore del p-value è maggiore di a
non rifiutiamo l'ipotesi nulla, se invece è minore o uguale di
a rifiutiamo l'ipotesi nulla.
Sempre
con
riferimento
all'esempio
precedente,
immaginiamo ora di voler verificare:
HO : p = 30
H1 : p # 30
nel caso in cui non conosciamo la deviazione standard
della popolazione ma conosciamo solo la deviazione
standard campionaria pari a 10. In questo caso ricorriamo
al test t di Student con (n-1) gradi di libertà
17
Calcoliamo il valore della statistica test:
t =
x - Ho
s
Vn
t =
10
27 - 30
10
=- 0,95
0,5
0,4
0,3
0,2
0,1
0,0
T
-4 -3,2-2,4-1,6-0,8 0 0,8 1,6 2,4 3,2 4
-2,26
2,26
Il valore della statistica test cade nella regione di
accettazione dell'ipotesi nulla quindi non rifiuto HO
La somma delle aree delle
due code è pari a 0,05
p>0.05
18
Esercizio
Si intende verificare se la quantità di arsenico di un
pozzo di acqua potabile è variata rispetto al valore pari
a 4.30 µg/l rilevato nell'anno precedente. Negli ultimi 3
mesi, sono state effettuate tre analisi: 4.4; 5.6; 5.1. Si
fissa un livello di significatività pari a 0.05.
19
Esercizio
HO : p = 4.30
H1 : u $ 4.30
t =
5 - 4.3
0.6
V3
= 2.107
2.107<4.30 quindi non rifiuto H0
p>0.05
20
Esercizio
La distribuzione delle pressioni diastoliche della popolazione
di donne diabetiche di età compresa tra 30 e 34 anni ha una
media non nota e una deviazione standard pari a 9,1 mmHg.
Può essere utile ai medici sapere se la media di questa
popolazione è uguale alla pressione diastolica media di 74.4
mmHg. della popolazione generale di donne di questa fascia
d'età.
a. Qual è l'ipotesi nulla?
b. Qual è l'ipotesi alternativa?
c. Si seleziona un campione casuale di dieci donne
diabetiche, la loro pressione diastolica media è 84 mmHg.
Utilizzando questa informazione, eseguire un test bilaterale
ad un livello di significatività a=0.05. Qual è il valore p del
test? Qual è la conclusione? E se si utilizza x=0.01?
21
Esercizio
a. Qual è l'ipotesi nulla?
b. Qual è l'ipotesi alternativa?
HO : p = 74.4
H1 : u $ 74.4
c. Si seleziona un campione casuale di dieci donne
diabetiche, la loro pressione diastolica media è 84 mmHg.
Utilizzando questa informazione, eseguire un test bilaterale
ad un livello di significatività a=0.05. Qual è il valore p del
test? Qual è la conclusione? E se si utilizza x=0.01?
Z=
84 -74.4
9.1
= 3.33
10
1.96<3.33
rifiuto H0
2.57<3.33
p<0.01
1
22
Esercizio
L'indice di massa corporea è calcolato dividendo il peso di un
soggetto per il quadrato della sua altezza; esso è misura del
grado di sovrappeso di un soggetto. Per la popolazione di
uomini di mezza età che svilupperanno il diabete mellito, la
distribuzione degli indici di massa corporea basali è
approssimativamente normale con una media ed una
deviazione standard non note. Un campione casuale di 58
soggetti selezionati da questo gruppo ha una media di 25kg/m2
ed una deviazione standard pari a 2.7kg/m2
a.Calcolare un intervallo di confidenza al 95% per la media
della popolazione
b. Ad un livello di significatività di 0.05, testare se l'indice medio
di massa corporea basale della popolazione di soggetti di
mezza età che svilupperanno il diabete è uguale a 24 kg/m2 ,
cioè il valore medio della popolazione che non sarà affetta da
tale patologia. Qual è il valore p del test?
23
c. Cosa si può concludere?
24
Esercizio
(x -t1 - a 1 2
*
s
; x +t1-a /2
-
*
s
n
)
Vn
(25 - 2 *
2.7
V58
;25 + 2 *
2.7
V58
)
IC 95 %( 24.3;25.7)
HO : u = 24
H1 : [ # 24
2.0 <2.86
t =
x
s
t =
25-24
2.7
58
0
= 2.86
p<0.05
Vn
Rifiuto H0
25
Esercizio
La popolazione di maschi che lavorano in industria a Londra e
che non hanno mai sofferto di patologia coronarica ha una
pressione sistolica media di 136 mmHg ed una pressione
diastolica media di 84 mmHg. Siamo interessati a determinare
se questi valori siano uguali a quelli dei lavoratori maschi che
invece hanno sofferto di patologia coronarica.
a. Un campione di 86 lavoratori che ha sofferto di patologia
coronarica ha una pressione sistolica media pari a 143 mmHg
ed una deviazione standard di 24,4 mmHg.
Testare l'ipotesi nulla che la pressione sistolica media della
popolazione di lavoratori che hanno sofferto di tale patologia è
uguale alla media dei lavoratori che invece non ne hanno
sofferto usando un test bilaterale ad un livello di significatività
pari a 0,10.
26