Corso di Statistica: oggetto, fonti dei dati e proprietà della media aritmetica

Slide da Clasfa su Corso di Statistica. Il Pdf, utile per studenti universitari di Economia, esplora l'oggetto della statistica, le fonti dei dati come censimenti e indagini campionarie, e le proprietà della media aritmetica.

Mostra di più

48 pagine

Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
1
Motivazione del corso
Viviamo nella società dell’ informazione
Per qualsiasi fenomeno è sempre più facile ottenere grandi quantità
di dati
Tuttavia i dati non sempre migliorano la conoscenza di un
fenomeno o sono di aiuto nel prendere decisioni
Esiste un problema di verifica e di interpretazione dei dati
La Statistica rappresenta uno strumento potente per la soluzione di
questi problemi.
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
2
Oggetto della statistica
Oggetto della statistica sono i fenomeni collettivi,
ossia quei fenomeni il cui studio richiede l’osservazione di un
insieme di manifestazioni individuali
(es. il reddito, le opinioni politiche, i consumi di un insieme di
individui, le rese di un insieme di terreni agricoli, l’inquinamento in
tempi successivi in una città…)
Elementi essenziali dei fenomeni collettivi:
Il collettivo, la popolazione a cui sono riferiti
Il presentarsi in modo variabile nelle singole unità
Il fatto che l’interesse sia concentrato sull’andamento d’insieme del
fenomeno
Lo scopo fondamentale della statistica è appunto quello di aiutarci
ad individuare regolarità nello studio dei fenomeni collettivi.
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
3
Un esempio storico
Studio del rapporto dei sessi alla nascita.
Fenomeno apparentemente casuale ma
Graunt (1662) osserva, studiando i registri parrocchiali di Londra,
che esiste un rapporto costante:
105 maschi ogni 100 femmine.
Varie interpretazioni: Sussmilch (1741) magnifica la provvidenza,
Darwin l’assestamento perfetto del meccanismo evoluzionistico.
I demografi lo utilizzano per valutare l’attendibilità del sistema di
registrazione delle nascite
Recentemente, ha permesso di individuare il fallimento
dell’attuazione del controllo demografico in Cina.
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
4
Domande fondamentali a cui risponde la statistica
Come sintetizzare grandi masse di dati? Come estrarre da un
insieme apparentemente caotico di dati le informazioni davvero
interessanti, quelle utili a prendere decisioni?
Con quali motivazioni posso estendere risultati che provengono
dall’analisi di un gruppo relativamente piccolo all’analisi del
collettivo molto più grande da cui gli elementi che ho osservato sono
stati estratti? O a collettivi in qualche modo analoghi lontani nel
tempo e nello spazio?
Queste due domande corrispondono ai due grandi capitoli della
statistica: statistica descrittiva (sintesi) e inferenza statistica
(induzione)
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
5
Informazioni, nuove conoscenze, decisioni
Volontà di aumentare la conoscenza di un fenomeno o
necessità di prendere decisioni
Raccolta di informazioni / Rilevazione
dei dati
Dati
Sintesi / Inferenza
Nuove conoscenze / Supporto alle
decisioni
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
6
Le fonti dei dati
Censimenti: rilevazioni esaustive di un insieme di caratteri su tutte
le unità di una popolazione (es. Censimento decennale della
Popolazione Italiana)
Indagini campionarie: per ragioni di costo, o di rapidità, si rilevano
i caratteri su un sottoinsieme delle unità che compongono la
popolazione di riferimento (campione)
Fonti amministrative: tutti gli insiemi di dati che vengono raccolti
non per lo studio di determinati fenomeni ma per altri motivi (es.
bilanci fiscali, DRG ospedalieri)
database di alto livello: sono ottenuti aggregando fonti eterogenee a
volte già oggetto di sintesi (es. tavole sinottiche negli Atlanti)
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
7
Le fonti Ufficiali in Italia
L’ Istituto Nazionale di Statistica, ISTAT, è attivo dal 1926, è
responsabile dei Censimenti e conduce numerose indagini
campionarie periodiche.
Con decreto legislativo 06/09/89 è stato istituito il SISTAN che
coordina gli enti "pubblici" che rilevano, elaborano e diffondono
informazioni statistiche:
ISTAT, uffici di Statistica delle Pubbliche Amm. (Regioni, Province,
Prefetture, Comuni, Asl)
Ogni anno l'Istat svolge circa 200 indagini.
3% ambiente
5% demografico
35% sociale
57% economico
Unità 1 - Corso di Statistica (CLASFA) – C. Trivisano
8
Indagine statistica
“Oggetto di ogni indagine statistica è la conoscenza di una
popolazione, intesa come insieme, come aggregato, di unità
elementari in cui il fenomeno allo studio si manifesta.
Le informazioni attorno alla popolazione, ossia attorno alle variabili
che la caratterizzano, possono essere il frutto di una rilevazione
totale o censuaria, oppure di una rilevazione campionaria.”
(Cicchitelli, Hertzel, Montanari, 1997)

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

Motivazione del corso di Statistica

Viviamo nella società dell'informazione Per qualsiasi fenomeno è sempre più facile ottenere grandi quantità di dati Tuttavia i dati non sempre migliorano la conoscenza di un fenomeno o sono di aiuto nel prendere decisioni Esiste un problema di verifica e di interpretazione dei dati La Statistica rappresenta uno strumento potente per la soluzione di questi problemi. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 1

Esempio storico: rapporto dei sessi alla nascita

Un esempio storico Studio del rapporto dei sessi alla nascita. Fenomeno apparentemente casuale ma Graunt (1662) osserva, studiando i registri parrocchiali di Londra, che esiste un rapporto costante: 105 maschi ogni 100 femmine. Varie interpretazioni: Sussmilch (1741) magnifica la provvidenza, Darwin l'assestamento perfetto del meccanismo evoluzionistico. I demografi lo utilizzano per valutare l'attendibilità del sistema di registrazione delle nascite Recentemente, ha permesso di individuare il fallimento dell'attuazione del controllo demografico in Cina. 3

Oggetto della statistica e fenomeni collettivi

Oggetto della statistica sono i fenomeni collettivi, ossia quei fenomeni il cui studio richiede l'osservazione di un insieme di manifestazioni individuali (es. il reddito, le opinioni politiche, i consumi di un insieme di individui, le rese di un insieme di terreni agricoli, l'inquinamento in tempi successivi in una città ... ) Elementi essenziali dei fenomeni collettivi: Il collettivo, la popolazione a cui sono riferiti Il presentarsi in modo variabile nelle singole unità Il fatto che l'interesse sia concentrato sull'andamento d'insieme del fenomeno Lo scopo fondamentale della statistica è appunto quello di aiutarci ad individuare regolarità nello studio dei fenomeni collettivi. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 2

Domande fondamentali della statistica

Domande fondamentali a cui risponde la statistica Come sintetizzare grandi masse di dati? Come estrarre da un insieme apparentemente caotico di dati le informazioni davvero interessanti, quelle utili a prendere decisioni? Con quali motivazioni posso estendere risultati che provengono dall'analisi di un gruppo relativamente piccolo all'analisi del collettivo molto più grande da cui gli elementi che ho osservato sono stati estratti? O a collettivi in qualche modo analoghi lontani nel tempo e nello spazio? Queste due domande corrispondono ai due grandi capitoli della statistica: statistica descrittiva (sintesi) e inferenza statistica (induzione) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 4

Informazioni, nuove conoscenze e decisioni

Informazioni, nuove conoscenze, decisioni Volontà di aumentare la conoscenza di un fenomeno o necessità di prendere decisioni 1 Raccolta di informazioni / Rilevazione dei dati Dati Sintesi / Inferenza Nuove conoscenze / Supporto alle decisioni Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 5 5

Le fonti dei dati statistici

Le fonti dei dati Censimenti: rilevazioni esaustive di un insieme di caratteri su tutte le unità di una popolazione (es. Censimento decennale della Popolazione Italiana) Indagini campionarie: per ragioni di costo, o di rapidità, si rilevano i caratteri su un sottoinsieme delle unità che compongono la popolazione di riferimento (campione) Fonti amministrative: tutti gli insiemi di dati che vengono raccolti non per lo studio di determinati fenomeni ma per altri motivi (es. bilanci fiscali, DRG ospedalieri) database di alto livello: sono ottenuti aggregando fonti eterogenee a volte già oggetto di sintesi (es. tavole sinottiche negli Atlanti) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 6

Le fonti Ufficiali in Italia: ISTAT e SISTAN

Le fonti Ufficiali in Italia L' Istituto Nazionale di Statistica, ISTAT, è attivo dal 1926, è responsabile dei Censimenti e conduce numerose indagini campionarie periodiche. Con decreto legislativo 06/09/89 è stato istituito il SISTAN che coordina gli enti "pubblici" che rilevano, elaborano e diffondono informazioni statistiche: ISTAT, uffici di Statistica delle Pubbliche Amm. (Regioni, Province, Prefetture, Comuni, Asl) Ogni anno l'Istat svolge circa 200 indagini. 3% ambiente 5% demografico 35% sociale 57% economico

Indagine statistica: conoscenza di una popolazione

Indagine statistica "Oggetto di ogni indagine statistica è la conoscenza di una popolazione, intesa come insieme, come aggregato, di unità elementari in cui il fenomeno allo studio si manifesta. .. Le informazioni attorno alla popolazione, ossia attorno alle variabili che la caratterizzano, possono essere il frutto di una rilevazione totale o censuaria, oppure di una rilevazione campionaria." (Cicchitelli, Hertzel, Montanari, 1997) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 7 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 8

Popolazione in statistica: reale e concettuale

Popolazioni reali e finite

Popolazione (1) In statistica "popolazione" ha un'accezione tecnica: possiamo infatti avere popolazioni di elettori, di industrie, di automobili, di animali, di istanti temporali successivi, di possibili risultati sperimentali. E' comunque fondamentale distinguere tra: · popolazioni reali (finite): sono formate da un numero finito di individui che è possibile identificare (cittadini italiani, auto immatricolate in Italia ad una certa data, aziende del settore tessile, ecc ... );

Popolazioni concettuali e infinite

· popolazioni concettuali (infinite): si tratta di popolazioni che non esistono in modo concreto. Sono composte da un numero indefinito di elementi (pezzi che una macchina può produrre, membri di una certa specie, l'insieme dei risultati prodotti dalla sperimentazione di un farmaco, ecc .. ). Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 9

Terminologia statistica: unità, variabile, modalità

Un po' di terminologia Gli elementi della popolazione sono in genere denominati unità statistiche Variabile (carattere) è il fenomeno oggetto di studio rilevato o misurato sulle unità statistiche I valori distinti assunti da una variabile sono detti modalità

Rilevazioni totali e parziali: vantaggi del campionamento

Rilevazioni totali e parziali Spesso, invece di studiare tutte le unità statistiche della popolazione (censimento), si procede a rilevare i caratteri oggetto di studio su un suo sottoinsieme (campione). I vantaggi delle indagini a campione sono i seguenti nelle popolazioni finite: · si riducono i costi · si riducono i tempi di elaborazione dei dati · si riducono gli errori di rilevazione dei caratteri nelle popolazioni infinite: · l'analisi di un campione è l'unico strumento investigativo di cui possiamo disporre (la popolazione esiste solo come entità astratta) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 10

Matrici di dati: struttura e rappresentazione

Matrici di dati Attraverso una rilevazione statistica otteniamo una matrice di dati, ossia una tabella di n righe e p colonne. Ogni riga rappresenta un'unità statistica In corrispondenza di ogni unità statistica leggiamo i valori delle variabili che vi abbiamo misurato. Ogni colonna rappresenta una variabile Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 11 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 12

Esempio 1: matrice di dati

Esempio 1 (matrice di dati) Unità Sesso Età Reddito (milioni) Statura (cm) Colore Occhi Titolo di studio Anno di nascita 1 Maschio 22 0.7 173 nero Diploma 1980 2 Femmina 18 0.2 168 marrone licenza media 1984 3 Femmina 34 1.6 165 marrone Laurea 1968 4 Maschio 42 2.5 180 nero Laurea 1960 5 Femmina 50 3.2 163 azzurro Diploma 1952 6 Femmina 12 0.1 160 giallo licenza elementare 1990 7 Maschio 46 4.4 177 marrone licenza media 1956 8 Maschio 72 1.3 164 verde licenza elementare 1930 9 Femmina 27 1.2 158 azzurro licenza media 1975 10 Femmina 48 1.7 170 nero Diploma 1954 11 Femmina 35 1.9 167 giallo Diploma 1967 12 Maschio 84 0.8 159 marrone licenza elementare 1918 13 Femmina 21 0.4 174 azzurro Diploma 1981 14 Femmina 44 1.8 164 verde licenza media 1958 15 Maschio 56 1.9 177 nero Diploma 1946 16 Femmina 58 3.2 172 nero Laurea 1944 17 Femmina 37 2.1 166 marrone Diploma 1965 18 Femmina 16 0.1 160 giallo licenza media 1986 19 Maschio 73 1.6 170 azzurro licenza elementare 1929 20 Maschio 64 2.2 184 verde licenza media 1938 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 13

Tipologia dei caratteri: classificazione e scale di misura

Caratteri qualitativi e quantitativi

Tipologia dei caratteri (1) I caratteri possono essere classificati in base alle loro modalità, ovvero in base alla loro "scala di misura" Sconnessi Qualitativi Ordinabili Tipi di Carattere Discreti Quantitativi Continui scala a intervalli scala a rapporti

Esempio 2: tabella paesi UE, 2001

Esempio 2 (tabella paesi UE, 2001) Paese Popola- zione Super- ficie Anno di ingresso nell'UE Temperatura media gennaio (capitale) Forma di Governo Confessione Prevalente Rate di S&P Spese R&S Austria 7,712 84 1995 1.8 Repubblica cattolica AAA 1.8 Belgio 9,950 30 1957 3.5 Monarchia cattolica AA+ 1.6 Danimarca 5,140 43 1973 1.7 Monarchia protestante AAA 2.1 Finlandia 4,986 338 1995 -2.2 Repubblica protestante AA+ 2.9 Francia 56,600 543 1957 5 Repubblica cattolica AAA 2.2 Germania 79,479 357 1957 1.8 repubblica protestante AAA 2.3 Grecia 10,123 131 1981 11.7 repubblica ortodossa A 0.5 Irlanda 3,503 70 1973 3.8 repubblica cattolica AA+ 1.5 Italia 56,800 301 1957 9.7 repubblica cattolica AA 1.1 Lussemb.o 381 3 1957 1.9 monarchia cattolica AAA 2 Paesi Bassi 14,833 42 1957 3.1 monarchia protestante AAA 2 Portogallo 10,251 91 1986 12.5 repubblica cattolica AA 0.6 Regno Unito 55,487 244 1973 3.7 monarchia protestante AAA 1.8 Spagna 36,950 489 1986 6.5 monarchia cattolica AA+ 0.9 Svezia 8,559 450 1995 -1.2 monarchia protestante AAA 3.8 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 14

Tipologia dei caratteri: approfondimento

Caratteri qualitativi: sconnessi e ordinabili

Tipologia dei caratteri (2) Caratteri qualitativi (o categoriali): le modalità sono espresse come aggettivi o qualità sconnessi: non è possibile alcun ordinamento tra le modalità ordinabili:esiste un ordinamento naturale tra le modalità

Caratteri quantitativi: continui e discreti

Caratteri quantitativi: le modalità sono dei numeri. Due possibili classificazioni: continui: le modalità sono espresse da numeri reali discreti:le modalità sono esprimibili da numeri interi o da un loro sottoinsieme scala a intervalli: l'origine della scala è arbitraria scala a rapporti: l'origine della scala non è arbitraria Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 15 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 16

Notazione statistica per variabili e modalità

Un po' di notazione In genere si indica con una lettera latina maiuscola una variabile, ad es. X e con x1,X2, ... ,X ;... rispettivamente le modalità assunte da X sulla prima, sulla seconda, ... e sulla i-esima unità statistica Quando le variabili sono più di una, esse possono essere denotate come X,Y, ... W oppure con una sola lettera alla quale viene aggiunto un pedice numerico per distinguere le diverse variabili X1, X2 ... , Xp In quest'ultimo caso x2,3 indica ad esempio la modalità assunta dalla variabile X3.sulla seconda unità statistica. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 17

Codifica disgiuntiva per caratteri qualitativi

Codifica numerica di caratteri qualitativi

Tipologia dei caratteri (continua) Anche i caratteri qualititativi possono essere codificati in modo "numerico": es: SESSO: maschio= 0 femmina= 1 Questa codifica è estremamente utile per le operazioni di conteggio, soprattutto se a farle è un computer. COLORE OCCHI: nero= 0 marrone= 1 azzurro= 2 giallo= 3 verde= 4 La codifica numerica non è in questo caso utile per i conteggi.

Variabili indicatrici nella codifica disgiuntiva

La codifica disgiuntiva Per caratteri qualitativi con più di due modalità, è possibile considerare una codifica disgiuntiva considerando delle variabili indicatrici, cioè tali che: x= 1 se la modalità k é presente nell'i-esima unità x= 0 se la modalità k é assente nell'i-esima unità. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 18

Esempio di codifica disgiuntiva: colore occhi

La codifica disgiuntiva (continua) Esempio: COLORE OCCHI : Unità Nero (X1) Marrone (X2) Azzurro (X3) Giallo (X4) Verde (X5) 1 1 0 0 0 0 2 0 1 0 0 0 3 0 1 0 0 0 4 1 0 0 0 0 5 0 0 1 0 0 6 0 0 0 1 0 7 0 1 0 0 0 8 0 0 0 0 1 9 0 0 1 0 0 10 1 0 0 0 0 11 0 0 0 1 0 12 0 1 0 0 0 13 0 0 1 0 0 14 0 0 0 0 1 15 1 0 0 0 0 16 1 0 0 0 0 17 0 1 0 0 0 18 0 0 0 1 0 19 0 0 1 0 0 20 0 0 0 0 1 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 19 20

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.