Slide di Università su Statistica (corso E). Il Pdf esplora il concetto di campionamento, i metodi probabilistici e non probabilistici, con esempi pratici. Questo materiale di Economia è ideale per lo studio autonomo a livello universitario.
Mostra di più47 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
Statistica (corso E) Anno accademico 2021-'22 Il campionamento Lucio Masserini
La necessità di ottenere informazioni statistiche sempre più accurate e disponibili in tempi rapidi costituisce indubbiamente uno degli aspetti salienti delle società moderne > tempestività per soddisfare le esigenze conoscitive di istituzioni pubbliche e imprese private. Tali informazioni si possono acquisire mediante indagini statistiche, che consistono nelle attività di raccolta ed elaborazione di dati riguardanti una o più caratteristiche di una popolazione di interesse.
Un'indagine statistica può essere condotta secondo due approcci differenti.
Indagine totale (o censimento) e indagine campionaria hanno la medesima finalità > conoscere alcune caratteristiche di una popolazione (ad es., livello delle spese degli italiani, grado di soddisfazione degli utenti di un servizio, etc.).
Un elemento critico del processo di acquisizione dei dati in un'indagine statistica è dovuto al fatto che spesso la popolazione di interesse è composta da un numero molto elevato di unità, la cui osservazione completa richiede costi e tempi proibitivi. Per tale ragione, spesso si ricorre alle indagini campionarie, in cui il processo di acquisizione dei dati si basa sull'osservazione di una parte delle unità della popolazione di interesse > campione inteso come sottoinsieme di unità scelte in modo da rappresentare la popolazione. Il campionamento è quindi il procedimento con il quale si seleziona (o si estrae) un campione da una popolazione.
CAMPIONE POPOLAZIONE
I principali fattori che possono far preferire un'indagine campionaria sono:
► Inoltre, la strategia campionaria è la sola possibile nel caso di:
L'inferenza statistica fornisce i metodi mediante i quali l'informazione contenuta in un campione selezionato con una procedura casuale viene estesa alla popolazione > induzione probabilistica (generalizzazione alla popolazione dei risultati campionari).
Esempio: indagine sui consumi degli italiani
Tuttavia, i metodi inferenziali non permettono di ottenere informazioni certe sulla popolazione, in quanto questa non viene osservata interamente > incertezza e probabilità.
? Popolazione (parametri) € Selezione del campione Inferenza statistica Campione (statistiche)
La popolazione è l'insieme finito o infinito di tutte le unità statistiche che riguardano il fenomeno oggetto di studio di un'indagine statistica.
Esempi
Esempi
Le caratteristiche di interesse di una popolazione possono essere sintetizzate da uno o più parametri > costanti numeriche (valori fissi) che descrivono la popolazione. I principali parametri che si utilizzano sono:
Esempi
−
...
In una popolazione finita di N unità in cui si osserva il carattere X, con valori x1, X2, ... , XN, i valori dei parametri media e varianza si ricavano nel modo seguente.
In una popolazione infinita, il carattere d'interesse può essere rappresentato da una variabile casuale X che avrà una certa distribuzione di probabilità. In questo si indica con «popolazione X» la variabile casuale X. I parametri sono quindi le costanti che descrivono le caratteristiche della distribuzione di probabilità o della funzione di densità della v.c. X:
v.c. discreta v. c. continua
Il campione è un sottoinsieme di unità estratte da una popolazione. Un campione dovrebbe essere estratto in modo da essere rappresentativo della popolazione > possibilità di estendere i risultati campionari alla popolazione.
Esempi Campione da popolazioni finite
Campione da popolazioni infinite
In un'indagine campionaria i parametri della popolazione non sono noti ma possono essere stimati utilizzando i dati campionari. Le statistiche sono misure di sintesi dei dati campionari. In generale, ogni parametro della popolazione ha un suo analogo nel campione > statistica.
Esempio: indagine sui consumi degli italiani
Le procedure inferenziali sono tre e sono tra loro interconnesse:
In generale, le stime ottenute su un campione non coincidono con i parametri incogniti della popolazione. In altri termini, una stima campionaria è sempre affetta da errore. Tale errore è il risultato di due componenti.
L'errore campionario è l'inevitabile errore che si commette quando si utilizza un campione per ottenere informazioni sulla popolazione. Poiché un campione fornisce informazioni incomplete sulla popolazione, un'indagine campionaria fornisce solo una stima del parametro che si vuole conoscere, dove il termine stima indica un valore approssimato della caratteristica nella popolazione da cui il campione deriva. Tuttavia, se il campione è di tipo probabilistico, l'errore campionario può essere controllato e misurato. In questo caso è possibile associare a ciascuna stima una misura del suo errore.
Esempio Indagine campionaria per conoscere il consumo medio di una popolazione
L'errore di copertura si verifica quando non c'è corrispondenza fra la popolazione oggetto di indagine e la lista (elenco) utilizzata per selezionare e contattare le unità statistiche. In generale, questo può accadere in due situazioni: