La verifica delle ipotesi statistiche: introduzione e test binomiale

Slide sulla Verifica delle Ipotesi. Il Pdf è una presentazione didattica universitaria di Matematica che introduce alla statistica inferenziale, con focus sulla verifica delle ipotesi e il test binomiale. Il materiale è schematico e ben strutturato, ideale per lo studio autonomo.

Mostra di più

23 pagine

VERIFICA

DELLE

IPOTESI

STATISTICA INFERENZIALE, IPOTESI

NULLA, ALTERNATIVA, LIVELLI DI

SIGNIFICATIVITA’, ERRORE DI I E II

TIPO

Introduzione

alla Statistica

Inferenziale

Vogliamo compiere delle inferenze sui parametri

della popolazione a partire dalle statistiche del

campione.

Verifica delle Ipotesi

Un fenomeno ha delle caratteristiche sulla

popolazione e date le risposte del campione

possiamo chiederci:

«Se nella popolazione le cose stanno come ho

ipotizzato, qual è la probabilità di ottenere un

campione con queste caratteristiche?»

Anteprima

STATISTICA INFERENZIALE, IPOTESI NULLA, ALTERNATIVA, LIVELLI DI SIGNIFICATIVITA', ERRORE DI I E II TIPO

Vogliamo compiere delle inferenze sui parametri della popolazione a partire dalle statistiche del campione.

Introduzione alla Statistica Inferenziale

Verifica delle Ipotesi

Un fenomeno ha delle caratteristiche sulla popolazione e date le risposte del campione possiamo chiederci: «Se nella popolazione le cose stanno come ho ipotizzato, qual è la probabilità di ottenere un campione con queste caratteristiche?»

Esempio di Verifica delle Ipotesi

Dobbiamo decidere se un mazzo di 40 carte (rosse o nere) è regolare oppure no in base all'estrazione di 10 carte (6R e 4N).

40 carte -> popolazione finita
10 carte -> campione
6 -> indicatore che descrive le caratteristiche del campione

Cerchiamo di capire cosa possiamo dire sulla regolarità del mazzo di carte utilizzando il dato sull'estrazione di alcune carte. Se ipotizziamo che in un mazzo regolare la proporzione di carte è del 50-50, ed estraendo 10 carte osserviamo una proporzione di 60-40. Possiamo ritenere a livello intuitivo che la differenza osservata nel campione rispetto alla popolazione sia casuale (ovvero legata alla natura del campionamento) -> Riteniamo probabile estrarre 6R su 10 se la popolazione è composta dal 50% di carte rosse. - > Concordanza tra ipotesi e dato campionario, portandoci a concludere che probabilmente le carte di quel mazzo sono 50-50. E nel caso osservassimo 9 carte rosse su 10?D Nel caso di campioni più grandi o addirittura infiniti, non possiamo avere il controllo sulla nostra inferenza. > Dobbiamo fare riferimento alla probabilità e capire che le nostre decisioni saranno soggette ad errore. L'obiettivo è ridurre il più possibile questo grado di errore

Ipotesi Nulla H0 e Ipotesi Alternativa H1

Vogliamo condurre una ricerca ed ipotizzare che l'atteggiamento verso la Statistica degli studenti iscritti a Psicologia sia diverso rispetto a quello di altri studenti che scelgono altre facoltà. Valutare l'atteggiamento (questionario). Valori bassi indicano un atteggiamento negativo, valori alti un atteggiamento positivo. In media l'atteggiamento verso la statistica della popolazione degli studenti universitari è u = 35. Selezionando un gruppo di 40 studenti di Psicologia, abbiamo una media di M = 32. A questo punto dobbiamo formulare delle ipotesi !!

Posso ipotizzare che gli studenti di Psicologia abbiano un atteggiamento diverso rispetto a quelli di altre facoltà. > la media dell'atteggiamento verso la statistica degli studenti di Psicologia è diversa dalla media degli altri studenti di altre facoltà, o l'ipotesi complementare che la media è uguale.

Ho -> O Ipotesi nulla. È l'ipotesi per cui si assume che non vi sia differenza. > Ipotesi di relazione di uguaglianza. (e.g. Le medie dei due gruppi sono uguali)
H1 > O Ipotesi alternativa. È l'ipotesi che assume che vi sia differenza. > Ipotesi di relazione di disuguaglianza (e.g. Le medie dei due gruppi sono differenti)

Obiettivo è la falsificazione dell'ipotesi nulla. Questo perché l'ipotesi nulla è sempre una sola, mentre quelle alternative possono essere infinite. Ipotesi può essere falsificata e non verificata !! Ogni conclusione è di natura probabilistica con un certo grado di errore.H 1 HD M = 32 M< 35 M = 35 M >35

Test statistico e distribuzione campionaria

Per capire se la media delle due popolazioni sono uguali o diverse, possiamo utilizzare specifici test statistici che consentono di riferire il dato campionario a distribuzioni di probabilità note, in modo tale da poter poi associare a tale dato un valore di probabilità. >
Lavoreremo su distribuzioni campionarie. Essendo il nostro caso un test basato sulla media, possiamo usare la distribuzione campionaria della media per procedere alla verifica di ipotesi.
Per n > 30 (teorema del limite centrale) sappiamo che la distribuzione delle medie campionarie è approssimabile a una normale.

Devo quindi stabilire se la differenza tra le medie della popolazione e del campione è aleatoria (ovvero dovuta al caso) e legata al campionamento; oppure se effettivamente stiamo parlando di una popolazione differente. Facciamo una valutazione in termini probabilistici, in relazione alla distribuzione campionaria di riferimento, applicando il test statistico adeguato.

Il livello a di significatività

Dobbiamo prendere la nostra decisione di tipo probabilistico sull'ipotesi nulla. > Dobbiamo fissare un valore soglia entro il quale l'ipotesi deve essere mantenuta e oltre il quale dobbiamo rifiutarla. Questo valore soglia è il p-value o livello di significatività. Ci sono valori convenzionali per cui al di sotto dei quali si falsifica l'ipotesi nulla quando si ha probabilità p che sia vera:

p ≤ 0.05 > Ovvero che non supera il 5% di questa probabilità
p ≤ 0.01 > Ovvero che non supera 1% di questa probabilità

a nei casi precedenti può assumere valori di 0.05 o 0.01.

a delimita una porzione di distribuzione campionaria, la regione di rifiuto dell'ipotesi nulla, che contiene tutti quei risultati che possono essere considerati improbabili posta vera tale ipotesi.
a è il grado di errore che accettiamo di correre nel prendere la nostra decisione

Test Mono o Bidirezionali

La differenza risiede nella possibilità di definire una direzionalità.

Test bidirezionali o a due code > La regione di rifiuto dell'ipotesi nulla viene ripartita equamente nelle due code della distribuzione di riferimento.
Test monodirezionali o a una coda -> Se si stabilisce una direzionalità nella differenza. La regione di rifiuto dell'ipotesi nulla si colloca in una delle due code della distribuzione di riferimento.
Se la media del campione è maggiore della media della popolazione -> monodirezionale destra

. Se la media del campione è minore della media della popolazione - monodirezionale sinistra La scelta della formulazione dell'ipotesi dipende dagli obiettivi della ricerca e deve essere formulata a priori.

Regola di decisione

Falsificare l'ipotesi nulla non significa aver provato con certezza che sia vera, ma che le informazioni a disposizioni, lette in termini probabilistici non supportano il suo rifiuto.
Analogamente non falsificare l'ipotesi nulla non vuol dire che abbiamo la certezza che questa sia falsa.

> Troviamo 4 casi possibili:

Due implicano una decisione corretta (Se la falsifichiamo quando era da falsificare, o non la falsifichiamo quando non era da falsificare)
Due rappresentano degli errori (Errori di I e II Tipo)

Realtà della Decisione presa

Ho vera Ho falsa Ho vera Decisione corretta: Non falsificare ipotesi nulla che non è falsificabile Errore II Tipo: Non falsificare ipotesi nulla che è falsificabile Ho falsa Errore I Tipo: Falsificare ipotesi nulla che in realtà non era da falsificare Decisione corretta: Falsificazione dell'ipotesi nulla che è falsificabile

Errore di I Tipo o errore a

Rifiutiamo l'Ipotesi nulla (H ) quando è vera. Esempi:
Studio sugli effetti di un farmaco: Immagina di condurre uno studio clinico per testare se un nuovo farmaco è efficace nel ridurre i sintomi di ansia. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che assume il farmaco e il gruppo che assume un placebo (H): 1 = u2). Se si commette un errore di tipo I, si potrebbe concludere erroneamente che il farmaco è efficace quando in realtà non lo è, portando a prescrizioni inutili e potenziali effetti collaterali indesiderati.
Ricerca psicologica sull'effetto di una terapia: Supponiamo di condurre uno studio per valutare l'efficacia di una terapia comportamentale per ridurre i sintomi di depressione. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che riceve la terapia e il gruppo che non la riceve. Se si commette un errore di tipo l, si potrebbe concludere erroneamente che la terapia è efficace quando in realtà non lo è, portando a raccomandazioni di trattamenti inefficaci.

Errore di II Tipo o errore B

Accettiamo l'Ipotesi nulla (H ) quando in realtà è falsa. Esempi:
Studio sugli effetti di un farmaco: Immagina di condurre uno studio clinico per testare se un nuovo farmaco è efficace nel ridurre i sintomi di ansia. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che assume il farmaco e il gruppo che assume un placebo (Ho: M1 = M2). Se si commette un errore di tipo II, si potrebbe non riconoscere che il farmaco e efficace, lasciando quindi senza trattamento i pazienti che potrebbero beneficiarne.
Ricerca psicologica sull'effetto di una terapia: Supponiamo di condurre uno studio per valutare l'efficacia di una terapia comportamentale per ridurre i sintomi di depressione. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che riceve la terapia e il gruppo che non la riceve. Se si commette un errore di tipo II, si potrebbe concludere erroneamente che la terapia non è efficace, lasciando senza trattamento pazienti che potrebbero trarne beneficio.

La probabilità di commettere un errore di I tipo è dato dal livello di significatività. Quindi 1 - a è la probabilità di accettarla correttamente. La probabilità di commettere un errore di II tipo è legato alla potenza del test (ovvero la capacità del test di falsificare l'ipotesi nulla quando è falsificabile). La potenza di un test statistico è la probabilità che il test rilevi un effetto quando effettivamente c'è uno. La potenza è determinata in termini di 1 - B. Tra a e ß esiste una relazione di complementarietà. Tanto più restringiamo a, tanto più aumenta ß, e viceversa. Possiamo scegliere un valore di a più basso al fine di ridurre l'errore di I tipo, ma accresciamo automaticamente la probabilità di commettere l'errore di II tipo.H 1 H. M = 32 1-B 1+2 7 M< 35 B M = 35 M >35

Verifica delle ipotesi a una variabile

Test di verifica delle ipotesi con una variabile dicotomica

Test Binomiale

Test di verifica delle ipotesi con una variabile continua

Test z della media e Test t di Student

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.

La verifica delle ipotesi statistiche: introduzione e test binomiale

Genera con l’AI

Anteprima

STATISTICA INFERENZIALE, IPOTESI NULLA, ALTERNATIVA, LIVELLI DI SIGNIFICATIVITA', ERRORE DI I E II TIPO

Introduzione alla Statistica Inferenziale

Verifica delle Ipotesi

Esempio di Verifica delle Ipotesi

Ipotesi Nulla H0 e Ipotesi Alternativa H1

Test statistico e distribuzione campionaria

Il livello a di significatività

Test Mono o Bidirezionali

Regola di decisione

Realtà della Decisione presa

Errore di I Tipo o errore a

Errore di II Tipo o errore B

Verifica delle ipotesi a una variabile

Test di verifica delle ipotesi con una variabile dicotomica

Test di verifica delle ipotesi con una variabile continua

Contenuti correlati