La statistica bivariata: correlazione lineare e diagramma a dispersione

Slide da IULM Università Iulm su La Statistica bivariata. Il Pdf, adatto per l'Università in Economia, esplora la correlazione lineare e la sua rappresentazione tramite diagrammi a dispersione, fornendo un'analisi chiara delle relazioni tra variabili.

Mostra di più

14 pagine

La Statistica bivariata
Il processo delle BA
Correlazione lineare
interdipendenza

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

IULM università iulm

La Statistica bivariata

La statistica bivariata considera contemporaneamente più aspetti o variabili su ogni unità per esplorare le loro connessioni (relazioni/associazioni). Ogni unità statistica ha due diverse VARIABILI (ad esempio X e Y). Essenzialmente i dati bivariati riguardano due variabili che possono essere:

  • qualitative, se costituite da variabili analizzate mediante misure di associazione.
  • quantitative, se costituita da variabili analizzate mediante correlazione e regressione.

La correlazione e la regressione sono due concetti diversi.Correlazione lineare

IULM università iulm

Correlazione lineare

La correlazione lineare misura se una variabile X e una variabile Y sono correlate tra loro, ovvero la loro tendenza a variare insieme (a 'covariare'). La correlazione indaga: a) X e Y aumentano entrambe? b) X e Y diminuiscono entrambe? c) Se X aumenta, Y decresce o viceversa? Y X 1 interdipendenzaCorrelazione lineare

IULM università iulm

Caratteristiche della correlazione

Le caratteristiche della correlazione: · il tipo di relazione tra X e Y, la quale relazione può essere lineare o non lineare. · la forma della relazione: direzione (positivo o negativa) e l'entità (forte versus debole).IULM università iulm

Rilevare la correlazione tra due variabili

Per rilevare la correlazione tra due variabili: Diagramma a dispersione (o scatterplot) che usa le coordinate Cartesiane per visualizzare i dati. I dati vengono visualizzati come un insieme di punti, ognuno dei quali ha il valore di una variabile che determina la posizione sull'asse orizzontale e il valore dell'altra variabile che determina la posizione sull'asse verticale. > Il calcolo del Coefficiente di Correlazione di Pearson che serve a quantificare la forza e la direzione della correlazione lineare.Correlazione lineare

IULM università iulm

Analisi di correlazione: diagramma di dispersione

Come primo STEP, per l'analisi di correlazione si visualizzano i dati bivariati nel diagramma di dispersione. 250 200 Consumo di carburante(kg) . . 150 100 50 . 0 14 16 18 20 22 24 26 28 30 Temperatura (°C)Correlazione lineare

IULM università iulm

Scatterplot

250 Consumo di carburante(kg) 200 150 100 50 0 14 19 24 29 Temperatura (°℃) · Il grafico a dispersione è un tipo di grafico o diagramma matematico che utilizza le coordinate cartesiane per visualizzare i valori delle due variabili. · Ogni punto del diagramma cartesiano rappresenta l'unità statistica data dalle due coordinate: le osservazioni di X e Y insieme. Le modalità coincidono con le coordinate cartesiane. · I punti non devono essere mai collegati tra loro.IULM università iulm

Interpretazione dello Scatterplot

Perfetta correlazione positiva Forte correlazione positiva Debole correlazione positiva Come si interpreta? Nessuna correlazione Debole correlazione negativa Forte correlazione negativa Perfetta correlazione negativaCorrelazione lineare

IULM università iulm

Coefficiente di correlazione di Pearson

Il coefficiente di correlazione di Pearson quantifica quanto le variabili X e Y sono correlate. Esso misura la forza e la direzione della relazione lineare tra due variabili ma non consente di catturare relazioni non lineari. CAMPIONE p (X, Y) =" 0x i=1 (Χί- μχ) N Vi - Hy Øy r (X, Y) = i=1 n Sy n -1 xi -x) (yi - >) SxCorrelazione lineare

IULM università iulm

Coefficiente di correlazione di Pearson: formula

N Σ i=1 Xi- Hx yi - Hy ZY p(X,Y) = * = i=1 N N Zi X . Y Scarto standardizzato per l'unità i-esima della variabile X Z Scarto standardizzato per l'unità i-esima della variabile Y N.B. La semplificazione può essere applicata sia alla formula della popolazione che a quella del campione. N ZîZ;Regressione lineare

IULM università iulm

Regressione lineare

La regressione è adottata per studiare la dipendenza tra due variabili X e Y. La variabile Y è usata per rappresentare la variabile dipendente o risposta i cui valori possono dipendere da un'altra variabile X indicata come indipendente, esplicativa o predittore . Pertanto, Y è una variabile di risposta alle modifiche della variabile X. Se la correlazione mostra una relazione lineare possiamo usare la regressione per fare previsioni riguardo alla variabile Y in base alla variabile X. Y X EFFETTO CAUSAIULM università iulm

Regressione lineare semplice

Se il diagramma di dispersione e il coefficiente di correlazione lineare indicano che esiste una relazione lineare tra due variabili Y e X, è possibile esprimere tale relazione attraverso una funzione lineare in grado di indicare il legame di dipendenza tra X e Y. Questa funzione lineare è la regressione lineare semplice. y XRegressione lineare

IULM università iulm

Definizione della retta di regressione

Rappresentiamo la regressione mediante il diagramma a dispersione, ma abbiamo bisogno di un modo affidabile e coerente per trovare la retta che meglio si adatta al nostro insieme di punti o la retta che si posiziona il più vicino possibile ai punti tracciati. Per definire la retta di regressione, dobbiamo considerare due caratteristiche: · L' intercetta (a) · La pendenza o coefficiente di regressione o angolare (b) La generica equazione di una retta: y = a + bx 1 y b a a = intercetta X b = pendenza o coefficiente angolareRegressione lineare

IULM università iulm

Equazione della retta e residuo

Trovare l'equazione della retta: La retta che meglio si adatta ai dati è quella che mostra un minore errore o valore residuo. Il residuo (o errore) è dato dalla differenza tra il valore osservato (yi) e il valore teorico, previsto o stimato (fi). y y Residuo = Osservato - Previsto Vi - Îi X X RESIDUO = yi - ÎiRegressione lineare

IULM università iulm

Stima della retta di regressione

La retta di regressione è stimata con il criterio dei minimi quadrati che minimizza la somma dei quadrati degli errori (o residui) tra i valori osservati e quelli teorici o previsti. n (y,- ŷ;)2 = minimo i=1 In altri termini, è la retta che minimizza i quadrati delle distanze tra tutti i valori osservati (yi) e quelli teorici (ŷ;), in corrispondenza di ciascun valore x ;.

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.