Serie Storiche: introduzione all'analisi con esempi reali, Unipd

Slide da Unipd.it su Serie Storiche. Il Pdf, utile per studenti universitari di Matematica, introduce l'analisi delle serie temporali, la stagionalità e i cicli, con esempi di dati epidemiologici e di consumo di gas.

Mostra di più

37 pagine

SERIE STORICHE (luisa.bisaglia@unipd.it)
1 INTRODUZIONE ALL’ANALISI DELLE SERIE STORICHE
1.1 Le serie temporali
Serie statistica: insieme di valori ordinati secondo un criterio qualitativo.
Serie storica/temporale: successione di osservazioni su una variabile numerica fatte sequenzialmente nel tempo; si
tratta di una serie statistica ordinata secondo criterio temporale. L’ordine dei dati non `e accidentale, gli elementi
devono essere ordinati in modo naturale dal valore dell’indice temporale. La maggior parte delle osservazioni sono
dipendenti tra loro (dato che sono legate nel tempo, si cerca di trasferire il dato nel futuro per ottenere previsioni)
e i dati presentano “regolarit`a” o persistenze legate alla posizione dell’osservazione nella sequenza.
Con regolarit`a si intende la stagionalit`a delle osservazioni. Un buon esempio di stagionalit`a `e la vendita dei
panettoni, che subisce un calo da febbraio fino a uno stop totale da marzo a ottobre e un lieve rialzo fino a
novembre, quando la vendita subisce un picco. Persistenza significa che i dati raccolti in un momento preciso
dipendono da ci`o che `e successo in passato.
Andamento giornaliero dell’epidemia da Covid-19 in Veneto (24.2.2020 - 25.9.2022) - Fonte: Pro-
tezione Civile
La linea nera raffigura la serie storica dei dati grezzi, mentre la
linea rossa rappresenta la serie pi`u liscia fatta con media delle
osservazioni della linea nera.
I cicli hanno ampiezza diversa e sono caratterizzati da una fase
di espansione in cui si raggiunge il punto massimo e poi si scende
fino al minimo. La salita e la discesa non sono necessariamente
simmetriche in una serie storica.
NB: il ciclo e la stagionalit`a non sono la stessa cosa.
Senza ordinamento temporale non `e possibile vedere il legame tra i
dati nel tempo: se ordinati casualmente, non hanno senso a livello
di continuit`a storica.
Consumo giornaliero di gas in due condomini in Alto Adige
Il primo condominio utilizza un riscaldamento centralizzato: il grafico risulta pi`u liscio in quanto si prende in
considerazione solo una fonte di gas. Nel secondo condominio, invece, si ha riscaldamento autonomo, risultando
in un grafico con pi`u picchi e pi`u variabilit`a, in quanto ogni famiglia ha la propria fonte di gas.
Tasso di disoccupazione mensile - Italia, 2004:1 - 2020:12, ISTAT
Nel grafico a destra sono rappresentati i dati grezzi del tasso di disoccupazione (`e
presente la stagionalit`a, con picchi che tendono a riprodursi negli stessi mesi; con i
dati destagionalizzati, la distribuzione `e molto pi`u liscia). La disoccupazione fem-
minile si muove allo stesso modo della disoccupazione maschile, tuttavia risulta pi`u
elevata.
1
`
E importante conoscere la frequenza di una serie. Nella maggioranza delle serie storiche si trattano intervalli
di frequenza uguali tra loro, ma esistono anche serie con intervalli disuguali tra una misurazione e la seguente.
Oltre alle serie storiche economiche, possono esserci anche serie storiche fisiche (es. livello settimanale delle
precipitazioni), serie storiche demografiche (es. popolazione residente annuale), serie storiche derivanti dal controllo
di processo (es. si controlla il processo contando il numero di oggetti prodotti in un lasso di tempo; se si raggiunge
il numero previsto, il macchinario funziona correttamente), serie storiche binarie (es. scelta tra due marche dello
stesso prodotto, accensione - spegnimento), serie storiche per dati di conteggio (si trattano solo di variabili discrete
- es. numero di persone in coda in cassa).
Precipitazioni piovose a Padova
Dati mensili (gennaio 2010 - luglio 2021). Fonte: ARPAV
Dato che si trattano dati mensili, la serie ha frequenza 12. Si nota un’evidente
stagionalit`a nella serie, con periodi con un maggior numero di precipitazioni
e periodi di precipitazioni minori.
Tasso mensile di natalit`a - Italia
Dati mensili (gennaio 2012 - aprile 2017). Fonte: ISTAT
Il grafico dimostra che il tasso mensile di natalit`a tende a decrescere dal 2012 in poi, con cicli annuali che indicano
una stagionalit`a nel concepimento dei bambini.
Movimenti sismici di magnitudo uguale o superiore a 4,0 per classe
di magnitudo - Anni
Dati annuali, 1950 - 2015. Fonte: ISTAT
Siccome si trattano dati annuali, nella serie la stagionalit`a non si trova, in
quanto non si possiede il dato disaggregato mensile o trimestrale, ma solo un
riassunto dell’anno. Questa serie `e particolarmente caratterizzata da picchi.
Anomalie temperatura globale terrestre
Dati mensili, 1950:1 - 2021:6. Fonte: HudCRUT4
Data una temperatura media in uno specifico anno, nel grafico si rappresentano scostamenti mensili della tempe-
ratura media di un mese dalla temperatura di riferimento. Dal grafico si nota che la temperatura sta tendendo
ad aumentare molto velocemente dal 1980.
1.2 Terminologia
Serie storica univariata: si osserva un solo fenomeno alla volta (es. la storia
del PIL)
Serie storica multivariata; si osservano pi`u fenomeni insieme (es. relazioni di
PIL dei paesi dell’UE)
Serie equispaziate nel tempo: la distanza tra due rilevazioni nella serie `e sem-
pre la stessa
L’indice temporale che definisce l’ordinamento dei dati `e t ed appartiene all’insieme parametrico T, il quale pu`o
essere continuo o discreto. t T .
Una serie storica pu`o essere continua/a parametro continuo (pur potendo il fenomeno osservato essere non conti-
nuo) o discreta/parametro discreto (pur potendo il fenomeno osservato essere non discreto).
Si trattano serie storiche univariate, discrete, riferite a tempi (intervalli o istanti) equispaziati:
y
1
, ..., y
t
, ..., y
n
{y
t
}
n
t=1
, in cui y
1
`e la prima osservazione, y
t
`e una generica osservazione nell’istante t e y
n
ultima
osservazione.
La cadenza temporale con cui osservare il fenomeno `e detta frequenza; la frequenza della serie `e il numero di
osservazioni che si hanno a disposizione in un certo periodo di tempo. La frequenza pi`u bassa che possiamo avere
2

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

INTRODUZIONE ALL'ANALISI DELLE SERIE STORICHE

Le serie temporali

Serie statistica: insieme di valori ordinati secondo un criterio qualitativo. Serie storica/temporale: successione di osservazioni su una variabile numerica fatte sequenzialmente nel tempo; si tratta di una serie statistica ordinata secondo criterio temporale. L'ordine dei dati non è accidentale, gli elementi devono essere ordinati in modo naturale dal valore dell'indice temporale. La maggior parte delle osservazioni sono dipendenti tra loro (dato che sono legate nel tempo, si cerca di trasferire il dato nel futuro per ottenere previsioni) e i dati presentano "regolarità" o persistenze legate alla posizione dell'osservazione nella sequenza. Con regolarità si intende la stagionalità delle osservazioni. Un buon esempio di stagionalità è la vendita dei panettoni, che subisce un calo da febbraio fino a uno stop totale da marzo a ottobre e un lieve rialzo fino a novembre, quando la vendita subisce un picco. Persistenza significa che i dati raccolti in un momento preciso dipendono da ciò che è successo in passato.

Andamento giornaliero dell'epidemia da Covid-19 in Veneto

Andamento giornaliero dell'epidemia da Covid-19 in Veneto (24.2.2020 - 25.9.2022) - Fonte: Pro- tezione Civile La linea nera raffigura la serie storica dei dati grezzi, mentre la linea rossa rappresenta la serie più liscia fatta con media delle osservazioni della linea nera. I cicli hanno ampiezza diversa e sono caratterizzati da una fase di espansione in cui si raggiunge il punto massimo e poi si scende fino al minimo. La salita e la discesa non sono necessariamente simmetriche in una serie storica. NB: il ciclo e la stagionalità non sono la stessa cosa. Senza ordinamento temporale non è possibile vedere il legame tra i dati nel tempo: se ordinati casualmente, non hanno senso a livello di continuità storica.

NUOVI POSITIVI/TAMPONI 25 Tuoi gestargeni 15 1820- 80-28- 1020-05-28 - 8-06-27 - 1020-47-27 120-08-26 - 108 16-25 - 00-11-24 (21-04-23 (21-85-23- 129-06-22 - (21-87-22 821-08-20 - Fonte: Protezione Civile

Consumo giornaliero di gas in due condomini in Alto Adige

Consumo giornaliero di gas in due condomini in Alto Adige Condominio 1 400 m^3/giorno 200 O 2014 2015 2016 Condominio 2 m^3/giorno 0 200 400 2014 2015 2016 2017 Il primo condominio utilizza un riscaldamento centralizzato: il grafico risulta più liscio in quanto si prende in considerazione solo una fonte di gas. Nel secondo condominio, invece, si ha riscaldamento autonomo, risultando in un grafico con più picchi e più variabilità, in quanto ogni famiglia ha la propria fonte di gas.

Tasso di disoccupazione mensile in Italia

Tasso di disoccupazione mensile - Italia, 2004:1 - 2020:12, ISTAT Nel grafico a destra sono rappresentati i dati grezzi del tasso di disoccupazione (è presente la stagionalità, con picchi che tendono a riprodursi negli stessi mesi; con i dati destagionalizzati, la distribuzione è molto più liscia). La disoccupazione fem- minile si muove allo stesso modo della disoccupazione maschile, tuttavia risulta più elevata.

16 maschi femmine totale 14 Tasso di disoccupazione 12 10 8 6 4 2004 2006 2008 2010 2012 2014 2016 2018 2020 1È importante conoscere la frequenza di una serie. Nella maggioranza delle serie storiche si trattano intervalli di frequenza uguali tra loro, ma esistono anche serie con intervalli disuguali tra una misurazione e la seguente. Oltre alle serie storiche economiche, possono esserci anche serie storiche fisiche (es. livello settimanale delle precipitazioni), serie storiche demografiche (es. popolazione residente annuale), serie storiche derivanti dal controllo di processo (es. si controlla il processo contando il numero di oggetti prodotti in un lasso di tempo; se si raggiunge il numero previsto, il macchinario funziona correttamente), serie storiche binarie (es. scelta tra due marche dello stesso prodotto, accensione - spegnimento), serie storiche per dati di conteggio (si trattano solo di variabili discrete - es. numero di persone in coda in cassa).

Precipitazioni piovose a Padova

Precipitazioni piovose a Padova Dati mensili (gennaio 2010 - luglio 2021). Fonte: ARPAV Dato che si trattano dati mensili, la serie ha frequenza 12. Si nota un'evidente stagionalità nella serie, con periodi con un maggior numero di precipitazioni e periodi di precipitazioni minori.

300 250 Precipitazioni piovose in mm 200 150 100 50 0 2010 2012 2014 2016 2018 2020 Dati mensili (gennaio 2010 - luglio 2021). Fonte: ARPAV

Tasso mensile di natalità in Italia

Tasso mensile di natalità - Italia Dati mensili (gennaio 2012 - aprile 2017). Fonte: ISTAT Il grafico dimostra che il tasso mensile di natalità tende a decrescere dal 2012 in poi, con cicli annuali che indicano una stagionalità nel concepimento dei bambini.

9 Movimenti sismici di magnitudo uguale o superiore a 4,0 per classe di magnitudo - Anni Dati annuali, 1950 - 2015. Fonte: ISTAT Siccome si trattano dati annuali, nella serie la stagionalità non si trova, in quanto non si possiede il dato disaggregato mensile o trimestrale, ma solo un riassunto dell'anno. Questa serie è particolarmente caratterizzata da picchi.

Anomalie temperatura globale terrestre

Anomalie temperatura globale terrestre Dati mensili, 1950:1 - 2021:6. Fonte: HudCRUT4 Data una temperatura media in uno specifico anno, nel grafico si rappresentano scostamenti mensili della tempe- ratura media di un mese dalla temperatura di riferimento. Dal grafico si nota che la temperatura sta tendendo ad aumentare molto velocemente dal 1980.

Terminologia delle serie storiche

Serie storica univariata: si osserva un solo fenomeno alla volta (es. la storia del PIL) Serie storica multivariata; si osservano più fenomeni insieme (es. relazioni di PIL dei paesi dell'UE) Serie equispaziate nel tempo: la distanza tra due rilevazioni nella serie è sem- pre la stessa

1.5 Anomalie della temperatura terrestre 1 0.5 0 0,5 -1 1860 1880 1900 1920 1940 1960 1980 2000 2020 L'indice temporale che definisce l'ordinamento dei dati è t ed appartiene all'insieme parametrico T, il quale può essere continuo o discreto. t E T. Una serie storica può essere continua/a parametro continuo (pur potendo il fenomeno osservato essere non conti- nuo) o discreta/parametro discreto (pur potendo il fenomeno osservato essere non discreto). Si trattano serie storiche univariate, discrete, riferite a tempi (intervalli o istanti) equispaziati: y1, ... , yt, ... , yn > {ytft=1, in cui y1 è la prima osservazione, yt è una generica osservazione nell'istante t e yn ultima osservazione. La cadenza temporale con cui osservare il fenomeno è detta frequenza; la frequenza della serie è il numero di osservazioni che si hanno a disposizione in un certo periodo di tempo. La frequenza più bassa che possiamo avere

8.5 di natalità 1.M. M . 1 7 100 90 80 70 scosse terremoto 60 50 40 30 20 10 0 1950 1960 1970 1980 1990 2000 2010 2in un anno è 1, per i dati trimestrali è 4, .... La frequenza aiuta in caso si dabbano stimare componenti legate alla stagionalità. Serie storica di dati di flusso: si ottiene aggregando o cumulando i dati raccolti in un periodo di tempo definito (es. numero di auto che passano in un giorno in una determinata via). Serie storica di dati di stock: fenomeno che si osserva in un dato istante di tempo (es. numero di auto presenti alle 8 in una determinata via, raccolte ogni giorno).

Obiettivi dell'analisi delle serie storiche

I dati nelle serie storiche dipendono l'uno dall'altro. L'obiettivo è modellare il fenomeno che li leva, poterli descrivere, spiegare, prevedere, filtrare, ... Descrizione: si leggono le prime informazioni sulle caratteristiche della serie, si individuano i valori anomali, si controlla la presenza di picchi, se la serie cresce o decresce, .... Si guarda tutto ciò che è possibile leggere dai dati. Spiegazione: si individua il meccanismo generatore dei dati, per vedere se i dati provengono da una variabile di interesse. Previsione: si fa inferenza sull'andamento del fenomeno, ossia i valori futuri di cui non si è a conoscenza. Sotto a determinate assunzioni, è possibile fare previsioni molto buone, in particolare quando si è a conoscenza del legame tra passato e futuro. Filtraggio: si stimano le componenti non osservabili contenute nella serie, la stagionalità, le componenti di errore. Controllo: di un sistema, di un sistema produttivo etc.

Processo generatore dei dati

Processo generatore della serie storica osservata: Yt= f(t) + ut f(t) è la componente sistematica, una funzione deterministica, ossia che sappiamo come si muove a seconda del variare di t. Si può considerare come la "legge" di evoluzione temporale del processo; ut è la componente stocastica. Entrambe le componenti sono non osservabili: osservando Y non siamo a conoscenza di quanta sua parte è ft e quanta è ut.

Approccio classico e moderno

Sono tre i disturbi puramente casuali processo a componenti incorrelate) o white noise (WN), Et: · Media nulla: E(ct) =0 ֏A · Varianza costante: Var(Et) = 0€ ֏A · Componenti incorrelate tra loro: ElErEs] = 0 rs Nell'approccio classico Ut è un errore di misura (ut = Et), non particolarmente importante, come nel modello di regressione. Nell'approccio moderno, invece, ut non è più misura di errori che sono white noise, ma è un processo a com- ponenti correlate: l'errore dipende da tutte le osservazioni passate e da tutti gli errori passati. Il legame non è deterministico, in quanto comunque €, che è white noise, è presente. ut = g(Yt-1, Yt-2, ... , Et-1, Et-2, ... ) + Et

Componenti di una serie storica

f(t) = f(Tt, Ct, St) Trend T} : tendenza di fondo, riferita ad un lungo periodo di tempo. Ha dinamica regolare, legata all'evoluzione strutturale del sistema. Ciclo Ct : componente legata all'alternarsi di fasi di espansione e di recessione del sistema economico. Fluttuazioni di periodo ampio (in genere qualche anno). Il ciclo è la componente più difficile da stimare; genericamente la si considera legata al trend. Stagionalità St : componente periodica estremamente regolare i cui effetti si esauriscono nell'arco dell'anno. È legata al trascorrere delle stagioni, influenzata da fattori climatici, sociali, che si ripetono nello stesso periodo dell'anno. Le osservazioni sono distanti tra loro 12 mesi, o 4 trimestri, sono collegate tra loro in qualche modo,

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.