La verifica delle ipotesi statistiche: introduzione e test binomiale

Slide sulla Verifica delle Ipotesi. Il Pdf è una presentazione didattica universitaria di Matematica che introduce alla statistica inferenziale, con focus sulla verifica delle ipotesi e il test binomiale. Il materiale è schematico e ben strutturato, ideale per lo studio autonomo.

Mostra di più

23 pagine

LA
VERIFICA
DELLE
IPOTESI
STATISTICA INFERENZIALE, IPOTESI
NULLA, ALTERNATIVA, LIVELLI DI
SIGNIFICATIVITA’, ERRORE DI I E II
TIPO
Introduzione
alla Statistica
Inferenziale
Vogliamo compiere delle inferenze sui parametri
della popolazione a partire dalle statistiche del
campione.
Verifica delle Ipotesi
Un fenomeno ha delle caratteristiche sulla
popolazione e date le risposte del campione
possiamo chiederci:
«Se nella popolazione le cose stanno come ho
ipotizzato, qual è la probabilità di ottenere un
campione con queste caratteristiche?»

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

STATISTICA INFERENZIALE, IPOTESI NULLA, ALTERNATIVA, LIVELLI DI SIGNIFICATIVITA', ERRORE DI I E II TIPO

Vogliamo compiere delle inferenze sui parametri della popolazione a partire dalle statistiche del campione.

Introduzione alla Statistica Inferenziale

Verifica delle Ipotesi

Un fenomeno ha delle caratteristiche sulla popolazione e date le risposte del campione possiamo chiederci: «Se nella popolazione le cose stanno come ho ipotizzato, qual è la probabilità di ottenere un campione con queste caratteristiche?»

Esempio di Verifica delle Ipotesi

Dobbiamo decidere se un mazzo di 40 carte (rosse o nere) è regolare oppure no in base all'estrazione di 10 carte (6R e 4N).

  • 40 carte -> popolazione finita
  • 10 carte -> campione
  • 6 -> indicatore che descrive le caratteristiche del campione

Cerchiamo di capire cosa possiamo dire sulla regolarità del mazzo di carte utilizzando il dato sull'estrazione di alcune carte. Se ipotizziamo che in un mazzo regolare la proporzione di carte è del 50-50, ed estraendo 10 carte osserviamo una proporzione di 60-40. Possiamo ritenere a livello intuitivo che la differenza osservata nel campione rispetto alla popolazione sia casuale (ovvero legata alla natura del campionamento) -> Riteniamo probabile estrarre 6R su 10 se la popolazione è composta dal 50% di carte rosse. - > Concordanza tra ipotesi e dato campionario, portandoci a concludere che probabilmente le carte di quel mazzo sono 50-50. E nel caso osservassimo 9 carte rosse su 10?D Nel caso di campioni più grandi o addirittura infiniti, non possiamo avere il controllo sulla nostra inferenza. > Dobbiamo fare riferimento alla probabilità e capire che le nostre decisioni saranno soggette ad errore. L'obiettivo è ridurre il più possibile questo grado di errore

Ipotesi Nulla H0 e Ipotesi Alternativa H1

Vogliamo condurre una ricerca ed ipotizzare che l'atteggiamento verso la Statistica degli studenti iscritti a Psicologia sia diverso rispetto a quello di altri studenti che scelgono altre facoltà. Valutare l'atteggiamento (questionario). Valori bassi indicano un atteggiamento negativo, valori alti un atteggiamento positivo. In media l'atteggiamento verso la statistica della popolazione degli studenti universitari è u = 35. Selezionando un gruppo di 40 studenti di Psicologia, abbiamo una media di M = 32. A questo punto dobbiamo formulare delle ipotesi !!

Posso ipotizzare che gli studenti di Psicologia abbiano un atteggiamento diverso rispetto a quelli di altre facoltà. > la media dell'atteggiamento verso la statistica degli studenti di Psicologia è diversa dalla media degli altri studenti di altre facoltà, o l'ipotesi complementare che la media è uguale.

  • Ho -> O Ipotesi nulla. È l'ipotesi per cui si assume che non vi sia differenza. > Ipotesi di relazione di uguaglianza. (e.g. Le medie dei due gruppi sono uguali)
  • H1 > O Ipotesi alternativa. È l'ipotesi che assume che vi sia differenza. > Ipotesi di relazione di disuguaglianza (e.g. Le medie dei due gruppi sono differenti)

Obiettivo è la falsificazione dell'ipotesi nulla. Questo perché l'ipotesi nulla è sempre una sola, mentre quelle alternative possono essere infinite. Ipotesi può essere falsificata e non verificata !! Ogni conclusione è di natura probabilistica con un certo grado di errore.H 1 HD M = 32 M< 35 M = 35 M >35

Test statistico e distribuzione campionaria

  • Per capire se la media delle due popolazioni sono uguali o diverse, possiamo utilizzare specifici test statistici che consentono di riferire il dato campionario a distribuzioni di probabilità note, in modo tale da poter poi associare a tale dato un valore di probabilità. >
  • Lavoreremo su distribuzioni campionarie. Essendo il nostro caso un test basato sulla media, possiamo usare la distribuzione campionaria della media per procedere alla verifica di ipotesi.
  • Per n > 30 (teorema del limite centrale) sappiamo che la distribuzione delle medie campionarie è approssimabile a una normale.

Devo quindi stabilire se la differenza tra le medie della popolazione e del campione è aleatoria (ovvero dovuta al caso) e legata al campionamento; oppure se effettivamente stiamo parlando di una popolazione differente. Facciamo una valutazione in termini probabilistici, in relazione alla distribuzione campionaria di riferimento, applicando il test statistico adeguato.

Il livello a di significatività

Dobbiamo prendere la nostra decisione di tipo probabilistico sull'ipotesi nulla. > Dobbiamo fissare un valore soglia entro il quale l'ipotesi deve essere mantenuta e oltre il quale dobbiamo rifiutarla. Questo valore soglia è il p-value o livello di significatività. Ci sono valori convenzionali per cui al di sotto dei quali si falsifica l'ipotesi nulla quando si ha probabilità p che sia vera:

  • p ≤ 0.05 > Ovvero che non supera il 5% di questa probabilità
  • p ≤ 0.01 > Ovvero che non supera 1% di questa probabilità

a nei casi precedenti può assumere valori di 0.05 o 0.01.

  • a delimita una porzione di distribuzione campionaria, la regione di rifiuto dell'ipotesi nulla, che contiene tutti quei risultati che possono essere considerati improbabili posta vera tale ipotesi.
  • a è il grado di errore che accettiamo di correre nel prendere la nostra decisione

Test Mono o Bidirezionali

La differenza risiede nella possibilità di definire una direzionalità.

  • Test bidirezionali o a due code > La regione di rifiuto dell'ipotesi nulla viene ripartita equamente nelle due code della distribuzione di riferimento.
  • Test monodirezionali o a una coda -> Se si stabilisce una direzionalità nella differenza. La regione di rifiuto dell'ipotesi nulla si colloca in una delle due code della distribuzione di riferimento.
  • Se la media del campione è maggiore della media della popolazione -> monodirezionale destra

. Se la media del campione è minore della media della popolazione - monodirezionale sinistra La scelta della formulazione dell'ipotesi dipende dagli obiettivi della ricerca e deve essere formulata a priori.

Regola di decisione

  • Falsificare l'ipotesi nulla non significa aver provato con certezza che sia vera, ma che le informazioni a disposizioni, lette in termini probabilistici non supportano il suo rifiuto.
  • Analogamente non falsificare l'ipotesi nulla non vuol dire che abbiamo la certezza che questa sia falsa.

> Troviamo 4 casi possibili:

  • Due implicano una decisione corretta (Se la falsifichiamo quando era da falsificare, o non la falsifichiamo quando non era da falsificare)
  • Due rappresentano degli errori (Errori di I e II Tipo)

Realtà della Decisione presa

Ho vera Ho falsa Ho vera Decisione corretta: Non falsificare ipotesi nulla che non è falsificabile Errore II Tipo: Non falsificare ipotesi nulla che è falsificabile Ho falsa Errore I Tipo: Falsificare ipotesi nulla che in realtà non era da falsificare Decisione corretta: Falsificazione dell'ipotesi nulla che è falsificabile

Errore di I Tipo o errore a

  • Rifiutiamo l'Ipotesi nulla (H ) quando è vera. Esempi:
  • Studio sugli effetti di un farmaco: Immagina di condurre uno studio clinico per testare se un nuovo farmaco è efficace nel ridurre i sintomi di ansia. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che assume il farmaco e il gruppo che assume un placebo (H): 1 = u2). Se si commette un errore di tipo I, si potrebbe concludere erroneamente che il farmaco è efficace quando in realtà non lo è, portando a prescrizioni inutili e potenziali effetti collaterali indesiderati.
  • Ricerca psicologica sull'effetto di una terapia: Supponiamo di condurre uno studio per valutare l'efficacia di una terapia comportamentale per ridurre i sintomi di depressione. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che riceve la terapia e il gruppo che non la riceve. Se si commette un errore di tipo l, si potrebbe concludere erroneamente che la terapia è efficace quando in realtà non lo è, portando a raccomandazioni di trattamenti inefficaci.

Errore di II Tipo o errore B

  • Accettiamo l'Ipotesi nulla (H ) quando in realtà è falsa. Esempi:
  • Studio sugli effetti di un farmaco: Immagina di condurre uno studio clinico per testare se un nuovo farmaco è efficace nel ridurre i sintomi di ansia. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che assume il farmaco e il gruppo che assume un placebo (Ho: M1 = M2). Se si commette un errore di tipo II, si potrebbe non riconoscere che il farmaco e efficace, lasciando quindi senza trattamento i pazienti che potrebbero beneficiarne.
  • Ricerca psicologica sull'effetto di una terapia: Supponiamo di condurre uno studio per valutare l'efficacia di una terapia comportamentale per ridurre i sintomi di depressione. L'ipotesi nulla potrebbe essere che non ci sono differenze significative nei sintomi tra il gruppo che riceve la terapia e il gruppo che non la riceve. Se si commette un errore di tipo II, si potrebbe concludere erroneamente che la terapia non è efficace, lasciando senza trattamento pazienti che potrebbero trarne beneficio.

La probabilità di commettere un errore di I tipo è dato dal livello di significatività. Quindi 1 - a è la probabilità di accettarla correttamente. La probabilità di commettere un errore di II tipo è legato alla potenza del test (ovvero la capacità del test di falsificare l'ipotesi nulla quando è falsificabile). La potenza di un test statistico è la probabilità che il test rilevi un effetto quando effettivamente c'è uno. La potenza è determinata in termini di 1 - B. Tra a e ß esiste una relazione di complementarietà. Tanto più restringiamo a, tanto più aumenta ß, e viceversa. Possiamo scegliere un valore di a più basso al fine di ridurre l'errore di I tipo, ma accresciamo automaticamente la probabilità di commettere l'errore di II tipo.H 1 H. M = 32 1-B 1+2 7 M< 35 B M = 35 M >35

Verifica delle ipotesi a una variabile

Test di verifica delle ipotesi con una variabile dicotomica

Test Binomiale

Test di verifica delle ipotesi con una variabile continua

Test z della media e Test t di Student

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.