Regressione con Dati Panel: caratteristiche e utilità in Economia

Slide dall'Università sulla Regressione con Dati Panel. Il Pdf, un documento didattico di Economia, illustra le caratteristiche e l'utilità dei dati panel, distinguendo tra bilanciati e non bilanciati, e mostra come eseguire test F su ipotesi congiunte usando STATA.

Ver más

36 páginas

1
Sezione 9.
Regressione con Dati Panel
Vincenzo Scoppa
Da Stock-Watson (cap. 10)
Ultima revisione: 09/04/2024
2
Caratteristiche e utilità dei dati panel
Il problema principale in un modello di regressione è tipicamente l’esistenza di variabili
omesse che provocano distorsione degli stimatori OLS
Un possibile rimedio è costituito dalle regressioni con Dati Panel (o dati longitudinali):
cioè dati in cui diverse entità (individui, imprese, regioni, Stati, ecc.) sono osservate per
più periodi di tempo:
Osservazioni su n entità per T periodi (dove T>=2)


i=1, 2, .., n t=1, 2, … T
i: rappresenta le diverse entità; t: rappresenta il tempo
Panel bilanciato: contiene tutte le osservazioni per ciascun i e per ciascun t.
Panel non bilanciato: contiene dati mancanti per qualche unità e per qualche periodo

Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

Caratteristiche e utilità dei dati panel

Il problema principale in un modello di regressione è tipicamente l'esistenza di variabili omesse che provocano distorsione degli stimatori OLS Un possibile rimedio è costituito dalle regressioni con Dati Panel (o dati longitudinali): cioè dati in cui diverse entità (individui, imprese, regioni, Stati, ecc.) sono osservate per più periodi di tempo: Osservazioni su n entità per T periodi (dove T>=2) Xit, Yit i=1,2, .. , n t=1,2, ... T i: rappresenta le diverse entità; t: rappresenta il tempo Panel bilanciato: contiene tutte le osservazioni per ciascun i e per ciascun t. Panel non bilanciato: contiene dati mancanti per qualche unità e per qualche periodo

Applicazione: Dati su fatality (vittime di incidenti stradali e tasse sugli alcolici)

osservazioni per 48 Stati americani (n=48) per T=7 anni (dal 1982 al 1988) Analisi econometrica per verificare se le tasse sugli alcolici (in particolare sulla birra), conducendo a un minor consumo di questi ultimi, determinano una riduzione di incidenti e vittime della strada variabile dipendente: fatality, numero di morti ogni 10mila abitanti variabile esplicativa: beertax, tasse (in $) per cassa di birra tab year ta state gen fatality=10000*mrall sort state year br state year fatality beertax

Analisi cross-section per il 1982

Usiamo solo un anno (1982) come cross-section reg fatality beertax if year == 1982 Source SS df MS Number of obs = 48 F (1, 46) 0.62 Model .279239808 1 .279239808 Prob > F 0.4347 Residual 20.6789826 46 .449543101 R-squared = 0.0133 Adj R-squared = -0.0081 Total 20.9582224 47 . 445919626 Root MSE . 67048 fatality Coef. Std. Err. t P>| t| [95% Conf. Interval] beertax .1484603 .1883682 0.79 0.435 -. 2307051 . 5276258 cons 2.010381 .1390785 14.46 0.000 1.730431 2.290332

Analisi cross-section per il 1988

. reg fatality beertax if year == 1988 Source SS df MS Number of obs 48 F (1, 46) 7.12 Model 1.71077215 1 1.71077215 Prob > F 0.0105 Residual 11.0559133 46 .24034594 R-squared 0.1340 Adj R-squared 0.1152 Total 12.7666854 47 .271631604 Root MSE = . 49025 fatality Coef. Std. Err. t P>|t| [95% Conf. Interval] beertax . 4387546 .1644538 2.67 0.011 .1077262 . 769783 _cons 1.859073 .1059887 17.54 0.000 1.645729 2.072417

Modello Pooled: ignorando la componente panel

_Modello Pooled: si ignora componente panel e si considerano tutte le n*T osservazioni come se fossero osservazioni indipendenti (336 Stati diversi!) . reg fatality beertax Source SS df MS Number of obs = 336 F (1, 334) = 34.39 Model 10.1686586 1 10.1686586 Prob > F 0.0000 Residual 98.7468513 334 .295649255 R-squared = 0.0934 Adj R-squared = 0.0906 Total 108.91551 335 .325120925 Root MSE . 54374 fatality Coef. Std. Err. t P>|t| [95% Conf. Interval] beertax .3646054 .0621698 5.86 0.000 .2423117 .4868992 cons 1.853308 . 0435671 42.54 0.000 1.767607 1.939008 _ = = Risultati sorprendenti!

Dati panel e variabili omesse

Ma nelle stime precedenti esiste un grande problema di variabili omesse: a livello di Stati, la qualità delle auto, le condizioni delle strade, gli atteggiamenti culturali, ecc., potrebbero essere correlati a beertax e incidere su fatality. Si potrebbero raccogliere dati su queste variabili, ma alcune sono difficilmente misurabili (es. atteggiamenti culturali) I dati panel - a certe condizioni - consentono di superare il problema della variabile omessa Come si vedrà, considerando le variazioni nel tempo per ogni unità è possibile neutralizzare alcune caratteristiche inosservabili (diverse per le unità ma costanti nel tempo) ed evitare distorsioni

Dati Panel con due periodi: confronto prima-dopo

Supponiamo che Zi sia una variabile omessa che incide sul tasso di fatality e che Zi cambi da Stato a Stato ma che non vari nel tempo (indicizzata con i ma non con t). Zi potrebbe essere una delle variabili menzionate (qualità delle auto, le condizioni delle strade, gli atteggiamenti culturali) Yit = Bo + B1BeerTaxit + B2Zi + uit Scriviamo l'equazione da stimare per l'anno 1982: Yi1982 = Bo + B1BeerTaxi1982 + B2Zi + Ui1982 L'equazione per l'anno 1988 sarà: Yi1988 = Bo + B1BeerTaxi1988 + B2Zi + Ui1988 Consideriamo le variazioni nel tempo (dal 1982 al 1988), sottraendo dalla seconda equazione la prima: Yi1988 - Yi1982 = B1(BeerTax(1988 - BeerTaxi1982) + (Ui1988 - Ui1982)

Regressione alle differenze

ΔΥ; = B1 ABeer Taxi + Δυ; [1] Come è evidente, prendendo le differenze nel tempo delle variabili, la variabile Z viene eliminata, cioè semplicemente non gioca alcun ruolo nello spiegare le variazioni di Y. La regressione alle differenze elimina l'effetto delle variazioni inosservate Zi (dato che per ogni Stato Z è costante nel tempo). Perciò ß1 può essere stimato senza distorsioni Da un punto di vista logico, se Z è costante nel tempo non può determinare le variazioni di Y

Applicazione con i dati di fatality: differenze temporali

Per ogni Stato creiamo le differenze temporali di Y e X e le mettiamo in relazione sort state year bysort state: gen D fatality=fatality-fatality [_n-6] bysort state: gen D beertax=beertax-beertax [ n-6] Source SS df MS Number of obs = 48 F (1, 46) = 6.22 Model .966449038 1 .966449038 Prob > F 0.0162 Residual 7.14175313 46 .155255503 R-squared 0.1192 Adj R-squared 0.1000 Total 8.10820217 47 .17251494 Root MSE .39402 D_fatality Coef. Std. Err. t P>|t| [95% Conf. Interval] D beertax -1.040973 . 4172279 -2.49 0.016 -1.880809 -. 2011364 _cons - -. 0720371 .060644 -1.19 0.241 -. 1941072 . 050033 Yi1988 - Yi1982 =- 0.072 - 1.04(BeerTaxi1988 - BeerTax(1982)

Effetto negativo delle tasse sulla birra sulle vittime di incidenti stradali

1 5 0 -. 5 -1 -1.5 - -. 6 -. 4 -. 2 0 .2 .4 D_beertax · D_fatality Fitted values Stimiamo un effetto negativo: all'aumentare delle tasse sulla birra, si riducono le vittime di incidenti stradali. La stima precedente non soffre di distorsione da variabile omessa. Infatti, Z non ha nessun ruolo nell'equazione [1] e quindi non è una variabile omessa!

Esempi di potenziale distorsione e rimedio con i Panel

Esempio Class Size

Esempio Class Size: stima dell'effetto può essere distorto se Qualità Docente è correlata alla dimensione della classe. TestScoreit = Bo + B1ClassSizeit + QualitaDocentei + Uit Con dati panel, se la Qualità Docente è costante nel tempo (time-invariant) si può mettere in relazione la variazione di Test Score rispetto alla variazione di Class Size.

Esempio: investimenti delle imprese e sussidi pubblici

Esempio: gli investimenti delle imprese sono stimolati dai sussidi pubblici? In un'analisi cross-section, possibile distorsione da variabile omessa se sussidi ottenuti da un'impresa sono correlati alle abilità manageriali (e se queste impattano sugli investimenti) I = Bo + B1Sussidi + u Con dati panel, con effetti fissi di impresa, le abilità manageriali sono neutralizzate e si mette in relazione la variazione I con la variazione sussidi.

Inconvenienti della stima in differenze

L'inconveniente di stimare l'equazione in differenze è che si perdono molte informazioni: per es., abbiamo usato solo i dati 1988 e 1982 (e solo 48 osservazioni invece di 336) Per evitare questo problema - ma neutralizzare l'effetto di variabili come Z - è possibile usare la regressione con effetti fissi

La regressione con effetti fissi

La regressione con effetti fissi è un metodo per tenere sotto controllo l'effetto delle variabili omesse, se queste non cambiano nel tempo ("time invariant"), sfruttando tutte le osservazioni per T periodi. Partiamo dal modello generale (si possono aggiungere altre variabili esplicative senza alcun problema): Yit = Bo + B1Xit + B2Zi + uit [1] Siccome Z varia tra le unità ma non nel tempo, possiamo scrivere: ai = Bo + B2Zi Yit = ai + B1Xit + Uit Gli ai sono definiti effetti fissi ("di Stato", in questo caso, visto che le entità sono gli Stati; se avessimo individui avremmo effetti fissi "individuali").

Equazioni per le entità 1, 2 e 3

Consideriamo l'equazione [1] per le entità 1, 2 e 3: Y1t = a1 + B1X1t + uit Y2t = @2 + B1X2t + U2t Y3t = @3 + B1X3t + U3t Queste equazioni rappresentano 3 differenti rette con diverse intercette (a1, a2, a3) ma stessa pendenza (31). E continuando si avrà: Y4t = a4 + B1X4t + U4t Y48t = @48 + B1X48t + U48t …

Rette con diverse intercette

a3 . .

Le rette con diverse intercette presentano una situazione simile a quella vista quando si è modellata la relazione tra salari e anni di istruzione, che tipicamente è distinta per uomini e donne (Sezione 7). W E(W|Uomo=1) E(W|Uomo=0) Bo+ B2 Istruzione La complicazione - se applichiamo lo stesso concetto alle differenze tra gli Stati nel tasso di fatality - è che sono presenti 48 differenti relazioni, una per ogni Stato, e quindi è necessario stimare 48 differenti intercette. Ogni intercetta coglie differenti livelli di Y, che possono essere spiegati da innumerevoli fattori, tra i quali anche dalle variabili omesse.

Effetto fisso per ogni entità

Pertanto, nonostante non sia possibile inserire direttamente nella regressione una variabile omessa si può tener conto del suo effetto sulla variabile dipendente considerando un "effetto fisso" diverso da unità a unità. L'elemento fondamentale è che inserendo un effetto fisso per ogni entità è possibile stimare ß1 senza distorsioni da variabili omesse (come sarà più chiaro nel seguito). L'inserimento degli effetti fissi consentirà di stimare ß1 - il vero effetto di interesse - che rappresenta la pendenza che è uguale per tutte le entità

Modello con effetti fissi: stima con dummy

Operativamente, il modello con effetti fissi ottenuto sopra: Yit = ai + B1Xit + Uit [2] può essere stimato inserendo N - 1 dummy (una si esclude per evitare la trappola delle variabili dummy), cioè una dummy per ogni entità: Yit = Bo + Y2D2+ V3D3;+ ... + YNDNA + B1Xit + Uit [3] D2¡ è una dummy=1 per l'entità 2 (e 0 per le altre entità), D3¡ è una dummy=1 per l'entità 3 (e 0 per le altre entità), ecc. Così, è possibile passare dal modello [2] al modello [3]: a1 = Bo a2 = Bo + Y2 a3 = B0 + Y3 ecc. [2] e [3] sono due modi equivalenti di scrivere il modello con effetti fissi È possibile estendere il modello agevolmente aggiungendo altri regressori X2, X3, ecc.

Stima con effetti fissi (dummy per ogni entità)

Prima creiamo le dummy di Stato: tab state, gen (state_) . reg fatality beertax state 2-state 48 Source SS df MS Number of obs 336 F (48, 287) 56.97 Model 98.5701359 48 2.0535445 Prob > F = 0.0000 Residual 10.3453741 287 . 036046599 R-squared = 0.9050 Adj R-squared = 0.8891 Total 108.91551 335 . 325120925 Root MSE .18986 fatality Coef. Std. Err. t P>|t| [95% Conf. Interval] beertax -. 6558736 .18785 -3.49 0.001 -1.025612 -. 2861352 state 2 -. 5677268 .2666662 -2.13 0.034 -1.092596 -. 0428573 state 3 -. 6549515 .2190203 -2.99 0.003 -1.086041 -. 2238616 state 4 -1.509469 .3043508 -4.96 0.000 -2.108512 -. 9104259 state 5 -1.48428 .2873532 -5.17 0.000 -2.049867 -. 9186933 _ _ _ _ = = =

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.