La Regressione con Discontinuità (RDD) in Econometria

Slide di Università sulla Regressione con Discontinuità (Regression Discontinuity Design: RDD). Il Pdf introduce la Regression Discontinuity Design (RDD), una tecnica di esperimenti naturali in Econometria, descrivendo origine, funzionamento basato su soglie e condizioni di applicazione, con grafici esplicativi.

Mostra di più

38 pagine

Sezione 14
La Regressione con Discontinuità
(Regression Discontinuity Design: RDD)
Vincenzo Scoppa
Corso di Econometria, a.a. 2023-2024
Ultima modifica: 22/05/2024
2
Regression Discontinuity Design
(RDD) - Introduzione
La Regression Discontinuity Design (RDD) o «Regressione con
Discontinuità» è una particolare tipologia di esperimenti naturali
Tecnica introdotta nel 1960 da Thistlethwaite e Campbell. Ignorata per
quasi 50 anni e riscoperta in Economia intorno al 2008-10
RDD basato su regole/istituzioni che condizionano l’accesso a un dato
trattamento al raggiungimento di certe soglie/condizioni
I soggetti che raggiungono o superano una certa soglia (cutoff) ricevono
un trattamento, coloro che non raggiungono la soglia non hanno accesso al
trattamento
Numerosi casi nella realtà hanno queste caratteristiche

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

Sezione 14

La Regressione con Discontinuità
(Regression Discontinuity Design: RDD)
Vincenzo Scoppa
Corso di Econometria, a.a. 2023-2024
Ultima modifica: 22/05/2024

Regression Discontinuity Design (RDD) - Introduzione

La Regression Discontinuity Design (RDD) o «Regressione con
Discontinuità» è una particolare tipologia di esperimenti naturali
Tecnica introdotta nel 1960 da Thistlethwaite e Campbell. Ignorata per
quasi 50 anni e riscoperta in Economia intorno al 2008-10
RDD basato su regole/istituzioni che condizionano l'accesso a un dato
trattamento al raggiungimento di certe soglie/condizioni
I soggetti che raggiungono o superano una certa soglia (cutoff) ricevono
un trattamento, coloro che non raggiungono la soglia non hanno accesso al
trattamento
Numerosi casi nella realtà hanno queste caratteristiche

Esempi di applicazione

  • Concessione di borse di studio basata sul voto di maturità (la
    borsa assegnata a coloro che ottengono almeno 90). Domanda
    di ricerca: La borsa di studio ha un impatto sul rendimento
    universitario?
  • Corso di formazione per coloro che hanno 50 anni o più
    (escludendo chi è più giovane). Domanda: il corso ha un
    impatto sulla probabilità di trovare un'occupazione?
  • Bonus 80 euro per chi guadagna meno di 26.000 euro. Il
    bonus ha un impatto sui consumi?

Altri esempi di applicazione

  • Dimensione classe: si sdoppia la classe se si arriva a 40
    alunni secondo la «regola di Maimonides» in Israele. Impatto
    su rendimento scolastico
  • Sostegno pubblico agli investimenti delle imprese sulla base
    di qualche punteggio: solo le prime 100 classificate
    ottengono il finanziamento
  • Fondi Sviluppo Europeo assegnati alle regioni con reddito
    pro-capite inferiore al 75% della media UE. Effetti su crescita
  • In un sistema elettorale uninominale, il candidato che ottiene
    un voto in più è eletto: effetti su politiche adottate dagli eletti

RDD: La logica di base

RDD si applica quando il trattamento T (binario) è una funzione
discontinua di qualche variabile X («assignment» o «forcing» o «running»
variable)
Due elementi fondamentali:
1) il trattamento è assegnato quando X raggiunge una certa soglia o
cutoff Xo, cioè X ≥ Xo (o, in alternativa, quando X ≤ X0)
2) i soggetti non hanno controllo completo di X, qualche elemento
casuale influenza X
Ciò implica che è possibile individuare soggetti con caratteristiche molto
simili ma con differente trattamento (si/no).
Il metodo RDD si basa essenzialmente sul confronto degli outcome
dei soggetti collocati intorno alla soglia

RDD: La logica di base (2)

In una prospettiva alternativa:
Mediante una regressione siamo in grado di tener conto
dell'effetto della variabile X sull'outcome Y, ma si assume che
questo effetto sia continuo, cioè non dovrebbe mostrare "salti"
(discontinuità) in prossimità della soglia (in assenza del
trattamento).
In entrambi i casi:
Se esiste una discontinuità nella funzione Y(X) che lega Y a X,
allora ciò costituisce evidenza di un effetto del trattamento

Analisi grafica fondamentale in RDD: Relazione tra variabile di assegnazione e outcome

E' opportuno mostrare in un diagramma scatter i dati con la
variabile forcing X sulle ascisse e l'outcome Y sulle ordinate
- Si mostra con una linea verticale il cutoff
- Piuttosto che mostrare tutte le osservazioni, tipicamente si
divide la X in «bins» (segmenti) (ad esempio, in 100 bins) e per
ogni bin si mostra la media degli outcome
- Si plotta la relazione stimata dalla regressione (i valori predetti
della Y)

Esempio 1: Relazione smooth tra variabile forcing e outcome: nessun effetto del trattamento

4
3
Outcome variable (Y)
2
.
.
1
0
Assignment variable (X)

Esempio 2: Variabile forcing e outcome: un esempio con discontinuità alla soglia

4
3
Outcome variable (Y)
2
B'
-
T
A"
1
0
c" c c'
Assignment variable (X)

Le due tipologie di RDD

Sharp RDD: il trattamento cambia deterministicamente al
superamento della soglia (per X2X0), cioè la probabilità di
trattamento passa da 0 a 1 alla soglia. Formalmente:
T=1 quando X2X0
T=0 quando X<X0
Fuzzy RDD: il trattamento cambia probabilisticamente quando la
X supera la soglia, vi è adesione imperfetta alla regola. Esempio:
corso di formazione (non tutti gli aventi diritto seguono il corso),
ma la probabilità di seguirlo cambia notevolmente in prossimità
della soglia
Fuzzy RDD corrisponde a una stima con Variabili Strumentali

Sharp RDD: La stima mediante modello OLS (approccio parametrico)

Nell'approccio che è definito «globale-parametrico», si usano tutte le
osservazioni disponibili
Lo stimatore OLS fornisce coefficienti e Standard Errors
Yi = Yo + YıXi + BTi + ui
Dove
Ti = 1 se Xi ≥ Xo
Ti = 0 se Xi < Xo
Il coefficiente ß rappresenta l'effetto del trattamento
La funzione yo + y1X cattura l'effetto della variabile X sull'outcome
In Stata: regress Y X trattamento, r

Un esempio numerico

Supponiamo di aver stimato con OLS la seguente relazione:
Y = 10 + 2X + 40T
X è una variabile continua, con valori da 0 a 100
Trattamento T assegnato quando X>=50:
T=0 se X<50;
T=1 se X≥50;

Rappresentazione grafica

Y = 10 + 2X + 40T
Y
150
110
10
50
X

Minacce alla validità interna della RDD

Tre possibili problemi che causano distorsioni nella stima RDD
1) Stima incorretta della funzione che lega Y a X:
a) Forma polinomiale
b) Differente forma funzionale sui due lati del cutoff
2) Impatto di altre variabili Wi su Y, congiuntamente a T
3) Non casualità di X intorno al cutoff (distribuzione disomogenea)
Per una analisi RDD rigorosa occorre controllare l'effettiva
esistenza di queste minacce

Diverse forme funzionali di Y(X)

ear El .| x
-
B. Nonlinear El
C. Nonlin
r discontinuity

Forme funzionali di Y(X) e rischi di distorsione

Y
cutoff
X
Y
cutoff
X

Modellare diverse forme funzionali della forcing variable

Rimedi: modellare forme funzionali alternative di X:
E' opportuno modellare polinomi di diverso grado (es. secondo o
terzo grado) della variabile X per catturare eventuali non linearità
e evitare di scambiare queste non linearità per discontinuità
Yi = Yo + BTi + Y1X +Y2 (Xi)2 + ... + ui

Diverse forme funzionali sui due lati del cutoff: interazioni

Forme funzionali alternative:
Uso di termini di interazione tra X e T per modellare funzioni di X
diverse sui due lati del cutoff. Definiamo X = (X - X0)
(una forma di standardizzazione della variabile forcing):
Yi = Yo + BTi + YiXi +Y2 XiT + ... + Ui
In alternativa, si possono usare contemporaneamente sia
polinomi di X che termini di interazione:
Yi = Yo + BTi + Vixi + Y2 (Xi) + Y3 TXi + VAT (Xi)-
+ ... +1

Tipica strategia di stima

Mostrare una serie di stime di diverse specificazioni per mostrare
che i risultati sono robusti:
1) X in forma lineare
2) Polinomio con X al quadrato
3) Polinomio cubico di X (forse ... , Gelman e Imbens (2018)
suggeriscono di non andare oltre il secondo ordine)
4) X lineare con un termine di interazione tra X e T
5) X quadratica con termini di interazione tra X, X quadro e T
6) E così via ....
Se X assume valori discreti, è opportuno clusterizzare gli Standard
Error a livello di X

Regressioni Locali Lineari (LLR) Approccio non parametrico (semplificato)

In alternativa ad usare il campione con tutte le osservazioni e trovare
la corretta forma funzionale tra Y e X, è opportuno focalizzarsi sulle
osservazioni in un range simmetrico intorno alla soglia
(«bandwidth»):
[X0 - h; X0 + h]
dove h è un qualche numero positivo
Per esempio, se h=10, si usano solo le osservazioni nell'intervallo:
[X]- 10; X0 + 10]
Concentrandosi solo su un piccolo intorno del cutoff, si può evitare il
problema di trovare la corretta forma per Y(X)
Tuttavia, il numero di osservazioni potrebbe essere molto piccolo > sorge
un trade-off tra non distorsione (poche obs. vicino la soglia) e precisione
dello stimatore (molte osservazioni ma funzione stimata erroneamente)

La scelta della Bandwidth nelle Regressioni Locali

Sono state sviluppate diverse procedure per scegliere la
«bandwidth» ottimale
(in Stata le procedure sono disponibili in "rdrobust", da scaricare)
Le più usate:
1) Calonico, Cattaneo, Titiunik, (2014). Robust Nonparametric
Confidence Intervals for Regression Discontinuity Designs.
Econometrica.
2) Imbens, Kalyanaraman, (2012). Optimal bandwidth choice
for the regression discontinuity estimator. Review of Economic
Studies.
Suggerimento: usare diverse bandwidth e mostrare che i risultati
sono robusti rispetto alle diverse bandwidth scelte

Regressioni Locali Lineari

E' possibile stimare con OLS una semplice regressione lineare:
Y = Yo + Y1X + BT + &
Usando le osservazioni solo nell'intervallo [X0 - h; X0 + h]
in Stata, semplicemente usando:
regress Y X T if X>= (X0-h) & X <= (X0+h)
dove XO è il cutoff e h un numero che può essere fissato,
alternativamente, a 5, a 10, a 15, ecc.
In aggiunta, a volte le osservazioni vengono "pesate" per dare più
importanza a quelle vicino al cutoff

Ponderazione delle osservazioni nelle LLR

Nelle Regressioni Locali Lineari alcuni ricercatori ponderano le osservazioni nella
bandwidth
La funzione di ponderazione (weighting function) è chiamata "Kernel"
Il metodo più semplice: le osservazioni nella bandwidth hanno lo stesso peso
("Uniform Kernel") (e peso=0 fuori la bandwidth)
Metodi più avanzati: si da un peso alle osservazioni in base alla vicinanza al cutoff
(Weighted OLS regressions), attribuendo più peso alle osservazioni vicine al cutoff
1) "Triangular or Edge Kernel" > peso=1-(|X ;- Xo]/h)
o K(u)=1-|u|
dove u= (Xi-X0)/h
2) Epanechnikov(parabolic): K(u)=(3/4)(1-u^2)
33
4
-

Controlli di validità della RDD (2): Manipolazione della forcing variable?

Occorre verificare che NON c'è stata "manipolazione" della forcing
variable: il numero di osservazioni n della variabile forcing nei
segmenti intorno al cutoff non dovrebbe mostrare discontinuità
Ciò assicura che non ci sono state intenzionalmente modifiche dei
valori della forcing variable intorno alla soglia (da parte dei
soggetti o da parte di altri)
E, di conseguenza, i soggetti sopra e sotto la soglia sono
comparabili
Si usa il Mccrary Test per verificarlo

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.