Statistica: introduzione al campionamento e ai suoi metodi

Slide di Università su Statistica (corso E). Il Pdf esplora il concetto di campionamento, i metodi probabilistici e non probabilistici, con esempi pratici. Questo materiale di Economia è ideale per lo studio autonomo a livello universitario.

Mostra di più

47 pagine

Lucio Masserini
Statistica (corso E)
Anno accademico 2021-’22
Il campionamento
Introduzione
La necessità di ottenere informazioni statistiche sempre più accurate e disponibili in tempi
rapidi costituisce indubbiamente uno degli aspetti salienti delle società moderne tempestività
per soddisfare le esigenze conoscitive di istituzioni pubbliche e imprese private.
Tali informazioni si possono acquisire mediante indagini statistiche, che consistono nelle attività
di raccolta ed elaborazione di dati riguardanti una o più caratteristiche di una popolazione di
interesse.
Esempi
Indagine sulle spese delle famiglie italiane
Indagine sulla soddisfazione degli utenti di un servizio di un’azienda di trasporti
Indagine sulle preferenze di voto alle prossime elezioni europee
Indagine sul mercato del lavoro (occupazione, disoccupazione, salari, etc.)
Indagine (o sondaggio) per conoscere l’opinione degli italiani sul governo
Il campionamento

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

Il campionamento

Statistica (corso E) Anno accademico 2021-'22 Il campionamento Lucio Masserini

Introduzione al campionamento

La necessità di ottenere informazioni statistiche sempre più accurate e disponibili in tempi rapidi costituisce indubbiamente uno degli aspetti salienti delle società moderne > tempestività per soddisfare le esigenze conoscitive di istituzioni pubbliche e imprese private. Tali informazioni si possono acquisire mediante indagini statistiche, che consistono nelle attività di raccolta ed elaborazione di dati riguardanti una o più caratteristiche di una popolazione di interesse.

Esempi di indagini statistiche

  • Indagine sulle spese delle famiglie italiane
  • Indagine sulla soddisfazione degli utenti di un servizio di un'azienda di trasporti
  • Indagine sulle preferenze di voto alle prossime elezioni europee
  • Indagine sul mercato del lavoro (occupazione, disoccupazione, salari, etc.)
  • Indagine (o sondaggio) per conoscere l'opinione degli italiani sul governo

Le indagini statistiche

Un'indagine statistica può essere condotta secondo due approcci differenti.

  • Indagine totale o censimento: mira a conoscere alcune caratteristiche di una popolazione osservando la totalità delle unità che la compongono > è semplice sul piano teorico ma è complessa nella pratica.
  • Indagine campionaria: consiste nell'estrazione di un campione di unità da una popolazione al fine di ottenere informazioni su alcune caratteristiche della popolazione > è più complessa sul piano teorico ma spesso di più facile attuazione.

Indagine totale (o censimento) e indagine campionaria hanno la medesima finalità > conoscere alcune caratteristiche di una popolazione (ad es., livello delle spese degli italiani, grado di soddisfazione degli utenti di un servizio, etc.).

Indagine campionaria e campionamento

Un elemento critico del processo di acquisizione dei dati in un'indagine statistica è dovuto al fatto che spesso la popolazione di interesse è composta da un numero molto elevato di unità, la cui osservazione completa richiede costi e tempi proibitivi. Per tale ragione, spesso si ricorre alle indagini campionarie, in cui il processo di acquisizione dei dati si basa sull'osservazione di una parte delle unità della popolazione di interesse > campione inteso come sottoinsieme di unità scelte in modo da rappresentare la popolazione. Il campionamento è quindi il procedimento con il quale si seleziona (o si estrae) un campione da una popolazione.

CAMPIONE POPOLAZIONE

Perché scegliere un'indagine campionaria

I principali fattori che possono far preferire un'indagine campionaria sono:

  • minori tempi e costi di realizzazione
  • possibilità di raccogliere un numero più elevato di informazioni > approfondimento
  • maggiore accuratezza nella rilevazione > ricorso a rilevatori qualificati

► Inoltre, la strategia campionaria è la sola possibile nel caso di:

  • popolazione troppo vasta
  • osservazione distruttiva > quando per esaminare una unità dobbiamo distruggerla (test di durata dei prodotti, ad es., per misurare la durata di una lampadina)
  • popolazioni infinite o non osservabili (potenziale) > ad es., test di qualità di un processo produttivo

Inferenza statistica

L'inferenza statistica fornisce i metodi mediante i quali l'informazione contenuta in un campione selezionato con una procedura casuale viene estesa alla popolazione > induzione probabilistica (generalizzazione alla popolazione dei risultati campionari).

  • Per fare inferenza, ovvero per conoscere o stimare le caratteristiche di interesse nella popolazione (parametri), si utilizzano delle misure di sintesi calcolate su un campione (statistiche).

Esempio di inferenza statistica

Esempio: indagine sui consumi degli italiani

  • Parametro > reddito medio delle famiglie italiane
  • Statistica > reddito medio calcolato sulle famiglie del campione

Tuttavia, i metodi inferenziali non permettono di ottenere informazioni certe sulla popolazione, in quanto questa non viene osservata interamente > incertezza e probabilità.

? Popolazione (parametri) € Selezione del campione Inferenza statistica Campione (statistiche)

La popolazione

La popolazione è l'insieme finito o infinito di tutte le unità statistiche che riguardano il fenomeno oggetto di studio di un'indagine statistica.

  • Popolazione finita: un insieme costituito da N unità, esistenti ed elencabili.

Esempi di popolazione finita

Esempi

  • collettivo di tutte le famiglie italiane
  • tutti gli utenti di un servizio
  • tutti i cittadini con diritto di voto
  • Popolazione infinita: composta da un numero molto elevato di unità potenzialmente osservabili e non necessariamente già esistenti fisicamente, di cui non è possibile elencare gli elementi.

Esempi di popolazione infinita

Esempi

  • tutti i potenziali acquirenti di un certo prodotto
  • tutti i prodotti che si possono ottenere in un processo produttivo
  • tutti coloro che potrebbero ammalarsi di una certa malattia

I parametri di una popolazione

Le caratteristiche di interesse di una popolazione possono essere sintetizzate da uno o più parametri > costanti numeriche (valori fissi) che descrivono la popolazione. I principali parametri che si utilizzano sono:

  • media
  • varianza (o scarto quadratico medio)
  • proporzione (o percentuale)

Esempi di parametri

Esempi

  • Il reddito medio di tutte le famiglie italiane > 23.452 euro
  • La percentuale di utenti soddisfatti di un servizio > 32,7%
  • La percentuale di votanti per il partito del Nulla > 25,2%

...

I parametri di una popolazione finita

In una popolazione finita di N unità in cui si osserva il carattere X, con valori x1, X2, ... , XN, i valori dei parametri media e varianza si ricavano nel modo seguente.

  • Media della popolazione: P = N H = 12 N i=1 Xi
  • Varianza della popolazione: 02 - HE. N li=1 (xi-u)2

I parametri di una popolazione infinita

In una popolazione infinita, il carattere d'interesse può essere rappresentato da una variabile casuale X che avrà una certa distribuzione di probabilità. In questo si indica con «popolazione X» la variabile casuale X. I parametri sono quindi le costanti che descrivono le caratteristiche della distribuzione di probabilità o della funzione di densità della v.c. X:

v.c. discreta v. c. continua

  • Media della popolazione: = E(X) = > xp(x) u = E (X) = -00 +00 x f (x)dx
  • Varianza della popolazione: 2 O = (xi-μχ) 2 p (x;) 0x = 1 -00 (x-x)2f(x)dx

Il campione

Il campione è un sottoinsieme di unità estratte da una popolazione. Un campione dovrebbe essere estratto in modo da essere rappresentativo della popolazione > possibilità di estendere i risultati campionari alla popolazione.

Esempi di campioni da popolazioni finite

Esempi Campione da popolazioni finite

  • collettivo di tutte le famiglie italiane > alcune famiglie italiane (quali?)
  • tutti gli utenti di un servizio > alcuni utenti del servizio (quali?)
  • tutti i cittadini con diritto di voto > alcuni cittadini con diritto di voto (quali?)

Esempi di campioni da popolazioni infinite

Campione da popolazioni infinite

  • tutti i prodotti che si possono ottenere in un processo produttivo > alcuni prodotti (quali?)

Il campione e le statistiche campionarie

In un'indagine campionaria i parametri della popolazione non sono noti ma possono essere stimati utilizzando i dati campionari. Le statistiche sono misure di sintesi dei dati campionari. In generale, ogni parametro della popolazione ha un suo analogo nel campione > statistica.

  • Parametro > sintesi numerica di una caratteristica della popolazione
  • Statistica campionaria > sintesi numerica della stessa caratteristica in un campione

Esempio di statistiche campionarie

Esempio: indagine sui consumi degli italiani

  • Parametro > reddito medio nella popolazione delle famiglie italiane
  • Statistica campionaria > reddito medio calcolato sulle famiglie del campione

Le procedure inferenziali

Le procedure inferenziali sono tre e sono tra loro interconnesse:

  • nella teoria della stima puntuale si cerca di determinare, sulla base delle informazioni campionarie, un valore numerico per il parametro di interesse che caratterizza la popolazione,
  • nella teoria degli intervalli di confidenza si cerca di determinare, sulla base dei dati campionari, un intervallo di valori in cui riporre una prefissata ed elevata fiducia per il parametro di interesse > «forbice» nei sondaggi,
  • nella teoria di verifica delle ipotesi si controlla, sulla base delle informazioni campionarie, quale tra due affermazioni complementari riferite ad un parametro della popolazione (dette «ipotesi statistiche») possa essere ritenuta maggiormente verosimile > prendere decisioni in condizioni di incertezza.

Gli errori nelle indagini statistiche

In generale, le stime ottenute su un campione non coincidono con i parametri incogniti della popolazione. In altri termini, una stima campionaria è sempre affetta da errore. Tale errore è il risultato di due componenti.

  • Errore campionario > indagini campionarie
  • Errore non campionario > indagine totale e campionaria
    • errore di copertura
    • errore da mancata risposta
    • errore di misurazione

Errore campionario

L'errore campionario è l'inevitabile errore che si commette quando si utilizza un campione per ottenere informazioni sulla popolazione. Poiché un campione fornisce informazioni incomplete sulla popolazione, un'indagine campionaria fornisce solo una stima del parametro che si vuole conoscere, dove il termine stima indica un valore approssimato della caratteristica nella popolazione da cui il campione deriva. Tuttavia, se il campione è di tipo probabilistico, l'errore campionario può essere controllato e misurato. In questo caso è possibile associare a ciascuna stima una misura del suo errore.

Esempio di errore campionario

Esempio Indagine campionaria per conoscere il consumo medio di una popolazione

  • 95 volte su 100 (probabilità) il consumo medio è di 23.452 euro (+ 420 euro)

Errore di copertura

L'errore di copertura si verifica quando non c'è corrispondenza fra la popolazione oggetto di indagine e la lista (elenco) utilizzata per selezionare e contattare le unità statistiche. In generale, questo può accadere in due situazioni:

  • la lista comprende unità non appartenenti alla popolazione di interesse > sovra copertura,
  • la lista non comprende tutte le unità appartenenti alla popolazione, quindi è incompleta > sotto copertura; in un'indagine campionaria è un problema serio poiché implica che alcune unità non hanno nessuna possibilità a far parte del campione.

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.