Slide da IULM Università Iulm su La Statistica bivariata. Il Pdf, adatto per l'Università in Economia, esplora la correlazione lineare e la sua rappresentazione tramite diagrammi a dispersione, fornendo un'analisi chiara delle relazioni tra variabili.
Mostra di più14 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
La statistica bivariata considera contemporaneamente più aspetti o variabili su ogni unità per esplorare le loro connessioni (relazioni/associazioni). Ogni unità statistica ha due diverse VARIABILI (ad esempio X e Y). Essenzialmente i dati bivariati riguardano due variabili che possono essere:
La correlazione e la regressione sono due concetti diversi.Correlazione lineare
La correlazione lineare misura se una variabile X e una variabile Y sono correlate tra loro, ovvero la loro tendenza a variare insieme (a 'covariare'). La correlazione indaga: a) X e Y aumentano entrambe? b) X e Y diminuiscono entrambe? c) Se X aumenta, Y decresce o viceversa? Y X 1 interdipendenzaCorrelazione lineare
Le caratteristiche della correlazione: · il tipo di relazione tra X e Y, la quale relazione può essere lineare o non lineare. · la forma della relazione: direzione (positivo o negativa) e l'entità (forte versus debole).IULM università iulm
Per rilevare la correlazione tra due variabili: Diagramma a dispersione (o scatterplot) che usa le coordinate Cartesiane per visualizzare i dati. I dati vengono visualizzati come un insieme di punti, ognuno dei quali ha il valore di una variabile che determina la posizione sull'asse orizzontale e il valore dell'altra variabile che determina la posizione sull'asse verticale. > Il calcolo del Coefficiente di Correlazione di Pearson che serve a quantificare la forza e la direzione della correlazione lineare.Correlazione lineare
Come primo STEP, per l'analisi di correlazione si visualizzano i dati bivariati nel diagramma di dispersione. 250 200 Consumo di carburante(kg) . . 150 100 50 . 0 14 16 18 20 22 24 26 28 30 Temperatura (°C)Correlazione lineare
250 Consumo di carburante(kg) 200 150 100 50 0 14 19 24 29 Temperatura (°℃) · Il grafico a dispersione è un tipo di grafico o diagramma matematico che utilizza le coordinate cartesiane per visualizzare i valori delle due variabili. · Ogni punto del diagramma cartesiano rappresenta l'unità statistica data dalle due coordinate: le osservazioni di X e Y insieme. Le modalità coincidono con le coordinate cartesiane. · I punti non devono essere mai collegati tra loro.IULM università iulm
Perfetta correlazione positiva Forte correlazione positiva Debole correlazione positiva Come si interpreta? Nessuna correlazione Debole correlazione negativa Forte correlazione negativa Perfetta correlazione negativaCorrelazione lineare
Il coefficiente di correlazione di Pearson quantifica quanto le variabili X e Y sono correlate. Esso misura la forza e la direzione della relazione lineare tra due variabili ma non consente di catturare relazioni non lineari. CAMPIONE p (X, Y) =" 0x i=1 (Χί- μχ) N Vi - Hy Øy r (X, Y) = i=1 n Sy n -1 xi -x) (yi - >) SxCorrelazione lineare
N Σ i=1 Xi- Hx yi - Hy ZY p(X,Y) = * = i=1 N N Zi X . Y Scarto standardizzato per l'unità i-esima della variabile X Z Scarto standardizzato per l'unità i-esima della variabile Y N.B. La semplificazione può essere applicata sia alla formula della popolazione che a quella del campione. N ZîZ;Regressione lineare
La regressione è adottata per studiare la dipendenza tra due variabili X e Y. La variabile Y è usata per rappresentare la variabile dipendente o risposta i cui valori possono dipendere da un'altra variabile X indicata come indipendente, esplicativa o predittore . Pertanto, Y è una variabile di risposta alle modifiche della variabile X. Se la correlazione mostra una relazione lineare possiamo usare la regressione per fare previsioni riguardo alla variabile Y in base alla variabile X. Y X EFFETTO CAUSAIULM università iulm
Se il diagramma di dispersione e il coefficiente di correlazione lineare indicano che esiste una relazione lineare tra due variabili Y e X, è possibile esprimere tale relazione attraverso una funzione lineare in grado di indicare il legame di dipendenza tra X e Y. Questa funzione lineare è la regressione lineare semplice. y XRegressione lineare
Rappresentiamo la regressione mediante il diagramma a dispersione, ma abbiamo bisogno di un modo affidabile e coerente per trovare la retta che meglio si adatta al nostro insieme di punti o la retta che si posiziona il più vicino possibile ai punti tracciati. Per definire la retta di regressione, dobbiamo considerare due caratteristiche: · L' intercetta (a) · La pendenza o coefficiente di regressione o angolare (b) La generica equazione di una retta: y = a + bx 1 y b a a = intercetta X b = pendenza o coefficiente angolareRegressione lineare
Trovare l'equazione della retta: La retta che meglio si adatta ai dati è quella che mostra un minore errore o valore residuo. Il residuo (o errore) è dato dalla differenza tra il valore osservato (yi) e il valore teorico, previsto o stimato (fi). y y Residuo = Osservato - Previsto Vi - Îi X X RESIDUO = yi - ÎiRegressione lineare
La retta di regressione è stimata con il criterio dei minimi quadrati che minimizza la somma dei quadrati degli errori (o residui) tra i valori osservati e quelli teorici o previsti. n (y,- ŷ;)2 = minimo i=1 In altri termini, è la retta che minimizza i quadrati delle distanze tra tutti i valori osservati (yi) e quelli teorici (ŷ;), in corrispondenza di ciascun valore x ;.