Slide da Clasfa su Corso di Statistica. Il Pdf, utile per studenti universitari di Economia, esplora l'oggetto della statistica, le fonti dei dati come censimenti e indagini campionarie, e le proprietà della media aritmetica.
See more48 Pages


Unlock the full PDF for free
Sign up to get full access to the document and start transforming it with AI.
Viviamo nella società dell'informazione Per qualsiasi fenomeno è sempre più facile ottenere grandi quantità di dati Tuttavia i dati non sempre migliorano la conoscenza di un fenomeno o sono di aiuto nel prendere decisioni Esiste un problema di verifica e di interpretazione dei dati La Statistica rappresenta uno strumento potente per la soluzione di questi problemi. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 1
Un esempio storico Studio del rapporto dei sessi alla nascita. Fenomeno apparentemente casuale ma Graunt (1662) osserva, studiando i registri parrocchiali di Londra, che esiste un rapporto costante: 105 maschi ogni 100 femmine. Varie interpretazioni: Sussmilch (1741) magnifica la provvidenza, Darwin l'assestamento perfetto del meccanismo evoluzionistico. I demografi lo utilizzano per valutare l'attendibilità del sistema di registrazione delle nascite Recentemente, ha permesso di individuare il fallimento dell'attuazione del controllo demografico in Cina. 3
Oggetto della statistica sono i fenomeni collettivi, ossia quei fenomeni il cui studio richiede l'osservazione di un insieme di manifestazioni individuali (es. il reddito, le opinioni politiche, i consumi di un insieme di individui, le rese di un insieme di terreni agricoli, l'inquinamento in tempi successivi in una città ... ) Elementi essenziali dei fenomeni collettivi: Il collettivo, la popolazione a cui sono riferiti Il presentarsi in modo variabile nelle singole unità Il fatto che l'interesse sia concentrato sull'andamento d'insieme del fenomeno Lo scopo fondamentale della statistica è appunto quello di aiutarci ad individuare regolarità nello studio dei fenomeni collettivi. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 2
Domande fondamentali a cui risponde la statistica Come sintetizzare grandi masse di dati? Come estrarre da un insieme apparentemente caotico di dati le informazioni davvero interessanti, quelle utili a prendere decisioni? Con quali motivazioni posso estendere risultati che provengono dall'analisi di un gruppo relativamente piccolo all'analisi del collettivo molto più grande da cui gli elementi che ho osservato sono stati estratti? O a collettivi in qualche modo analoghi lontani nel tempo e nello spazio? Queste due domande corrispondono ai due grandi capitoli della statistica: statistica descrittiva (sintesi) e inferenza statistica (induzione) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 4
Informazioni, nuove conoscenze, decisioni Volontà di aumentare la conoscenza di un fenomeno o necessità di prendere decisioni 1 Raccolta di informazioni / Rilevazione dei dati Dati Sintesi / Inferenza Nuove conoscenze / Supporto alle decisioni Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 5 5
Le fonti dei dati Censimenti: rilevazioni esaustive di un insieme di caratteri su tutte le unità di una popolazione (es. Censimento decennale della Popolazione Italiana) Indagini campionarie: per ragioni di costo, o di rapidità, si rilevano i caratteri su un sottoinsieme delle unità che compongono la popolazione di riferimento (campione) Fonti amministrative: tutti gli insiemi di dati che vengono raccolti non per lo studio di determinati fenomeni ma per altri motivi (es. bilanci fiscali, DRG ospedalieri) database di alto livello: sono ottenuti aggregando fonti eterogenee a volte già oggetto di sintesi (es. tavole sinottiche negli Atlanti) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 6
Le fonti Ufficiali in Italia L' Istituto Nazionale di Statistica, ISTAT, è attivo dal 1926, è responsabile dei Censimenti e conduce numerose indagini campionarie periodiche. Con decreto legislativo 06/09/89 è stato istituito il SISTAN che coordina gli enti "pubblici" che rilevano, elaborano e diffondono informazioni statistiche: ISTAT, uffici di Statistica delle Pubbliche Amm. (Regioni, Province, Prefetture, Comuni, Asl) Ogni anno l'Istat svolge circa 200 indagini. 3% ambiente 5% demografico 35% sociale 57% economico
Indagine statistica "Oggetto di ogni indagine statistica è la conoscenza di una popolazione, intesa come insieme, come aggregato, di unità elementari in cui il fenomeno allo studio si manifesta. .. Le informazioni attorno alla popolazione, ossia attorno alle variabili che la caratterizzano, possono essere il frutto di una rilevazione totale o censuaria, oppure di una rilevazione campionaria." (Cicchitelli, Hertzel, Montanari, 1997) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 7 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 8
Popolazione (1) In statistica "popolazione" ha un'accezione tecnica: possiamo infatti avere popolazioni di elettori, di industrie, di automobili, di animali, di istanti temporali successivi, di possibili risultati sperimentali. E' comunque fondamentale distinguere tra: · popolazioni reali (finite): sono formate da un numero finito di individui che è possibile identificare (cittadini italiani, auto immatricolate in Italia ad una certa data, aziende del settore tessile, ecc ... );
· popolazioni concettuali (infinite): si tratta di popolazioni che non esistono in modo concreto. Sono composte da un numero indefinito di elementi (pezzi che una macchina può produrre, membri di una certa specie, l'insieme dei risultati prodotti dalla sperimentazione di un farmaco, ecc .. ). Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 9
Un po' di terminologia Gli elementi della popolazione sono in genere denominati unità statistiche Variabile (carattere) è il fenomeno oggetto di studio rilevato o misurato sulle unità statistiche I valori distinti assunti da una variabile sono detti modalità
Rilevazioni totali e parziali Spesso, invece di studiare tutte le unità statistiche della popolazione (censimento), si procede a rilevare i caratteri oggetto di studio su un suo sottoinsieme (campione). I vantaggi delle indagini a campione sono i seguenti nelle popolazioni finite: · si riducono i costi · si riducono i tempi di elaborazione dei dati · si riducono gli errori di rilevazione dei caratteri nelle popolazioni infinite: · l'analisi di un campione è l'unico strumento investigativo di cui possiamo disporre (la popolazione esiste solo come entità astratta) Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 10
Matrici di dati Attraverso una rilevazione statistica otteniamo una matrice di dati, ossia una tabella di n righe e p colonne. Ogni riga rappresenta un'unità statistica In corrispondenza di ogni unità statistica leggiamo i valori delle variabili che vi abbiamo misurato. Ogni colonna rappresenta una variabile Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 11 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 12
Esempio 1 (matrice di dati) Unità Sesso Età Reddito (milioni) Statura (cm) Colore Occhi Titolo di studio Anno di nascita 1 Maschio 22 0.7 173 nero Diploma 1980 2 Femmina 18 0.2 168 marrone licenza media 1984 3 Femmina 34 1.6 165 marrone Laurea 1968 4 Maschio 42 2.5 180 nero Laurea 1960 5 Femmina 50 3.2 163 azzurro Diploma 1952 6 Femmina 12 0.1 160 giallo licenza elementare 1990 7 Maschio 46 4.4 177 marrone licenza media 1956 8 Maschio 72 1.3 164 verde licenza elementare 1930 9 Femmina 27 1.2 158 azzurro licenza media 1975 10 Femmina 48 1.7 170 nero Diploma 1954 11 Femmina 35 1.9 167 giallo Diploma 1967 12 Maschio 84 0.8 159 marrone licenza elementare 1918 13 Femmina 21 0.4 174 azzurro Diploma 1981 14 Femmina 44 1.8 164 verde licenza media 1958 15 Maschio 56 1.9 177 nero Diploma 1946 16 Femmina 58 3.2 172 nero Laurea 1944 17 Femmina 37 2.1 166 marrone Diploma 1965 18 Femmina 16 0.1 160 giallo licenza media 1986 19 Maschio 73 1.6 170 azzurro licenza elementare 1929 20 Maschio 64 2.2 184 verde licenza media 1938 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 13
Tipologia dei caratteri (1) I caratteri possono essere classificati in base alle loro modalità, ovvero in base alla loro "scala di misura" Sconnessi Qualitativi Ordinabili Tipi di Carattere Discreti Quantitativi Continui scala a intervalli scala a rapporti
Esempio 2 (tabella paesi UE, 2001) Paese Popola- zione Super- ficie Anno di ingresso nell'UE Temperatura media gennaio (capitale) Forma di Governo Confessione Prevalente Rate di S&P Spese R&S Austria 7,712 84 1995 1.8 Repubblica cattolica AAA 1.8 Belgio 9,950 30 1957 3.5 Monarchia cattolica AA+ 1.6 Danimarca 5,140 43 1973 1.7 Monarchia protestante AAA 2.1 Finlandia 4,986 338 1995 -2.2 Repubblica protestante AA+ 2.9 Francia 56,600 543 1957 5 Repubblica cattolica AAA 2.2 Germania 79,479 357 1957 1.8 repubblica protestante AAA 2.3 Grecia 10,123 131 1981 11.7 repubblica ortodossa A 0.5 Irlanda 3,503 70 1973 3.8 repubblica cattolica AA+ 1.5 Italia 56,800 301 1957 9.7 repubblica cattolica AA 1.1 Lussemb.o 381 3 1957 1.9 monarchia cattolica AAA 2 Paesi Bassi 14,833 42 1957 3.1 monarchia protestante AAA 2 Portogallo 10,251 91 1986 12.5 repubblica cattolica AA 0.6 Regno Unito 55,487 244 1973 3.7 monarchia protestante AAA 1.8 Spagna 36,950 489 1986 6.5 monarchia cattolica AA+ 0.9 Svezia 8,559 450 1995 -1.2 monarchia protestante AAA 3.8 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 14
Tipologia dei caratteri (2) Caratteri qualitativi (o categoriali): le modalità sono espresse come aggettivi o qualità sconnessi: non è possibile alcun ordinamento tra le modalità ordinabili:esiste un ordinamento naturale tra le modalità
Caratteri quantitativi: le modalità sono dei numeri. Due possibili classificazioni: continui: le modalità sono espresse da numeri reali discreti:le modalità sono esprimibili da numeri interi o da un loro sottoinsieme scala a intervalli: l'origine della scala è arbitraria scala a rapporti: l'origine della scala non è arbitraria Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 15 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 16
Un po' di notazione In genere si indica con una lettera latina maiuscola una variabile, ad es. X e con x1,X2, ... ,X ;... rispettivamente le modalità assunte da X sulla prima, sulla seconda, ... e sulla i-esima unità statistica Quando le variabili sono più di una, esse possono essere denotate come X,Y, ... W oppure con una sola lettera alla quale viene aggiunto un pedice numerico per distinguere le diverse variabili X1, X2 ... , Xp In quest'ultimo caso x2,3 indica ad esempio la modalità assunta dalla variabile X3.sulla seconda unità statistica. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 17
Tipologia dei caratteri (continua) Anche i caratteri qualititativi possono essere codificati in modo "numerico": es: SESSO: maschio= 0 femmina= 1 Questa codifica è estremamente utile per le operazioni di conteggio, soprattutto se a farle è un computer. COLORE OCCHI: nero= 0 marrone= 1 azzurro= 2 giallo= 3 verde= 4 La codifica numerica non è in questo caso utile per i conteggi.
La codifica disgiuntiva Per caratteri qualitativi con più di due modalità, è possibile considerare una codifica disgiuntiva considerando delle variabili indicatrici, cioè tali che: x= 1 se la modalità k é presente nell'i-esima unità x= 0 se la modalità k é assente nell'i-esima unità. Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 18
La codifica disgiuntiva (continua) Esempio: COLORE OCCHI : Unità Nero (X1) Marrone (X2) Azzurro (X3) Giallo (X4) Verde (X5) 1 1 0 0 0 0 2 0 1 0 0 0 3 0 1 0 0 0 4 1 0 0 0 0 5 0 0 1 0 0 6 0 0 0 1 0 7 0 1 0 0 0 8 0 0 0 0 1 9 0 0 1 0 0 10 1 0 0 0 0 11 0 0 0 1 0 12 0 1 0 0 0 13 0 0 1 0 0 14 0 0 0 0 1 15 1 0 0 0 0 16 1 0 0 0 0 17 0 1 0 0 0 18 0 0 0 1 0 19 0 0 1 0 0 20 0 0 0 0 1 Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano Unità 1 - Corso di Statistica (CLASFA) - C. Trivisano 19 20