Slide dall'Università Telematica degli Studi Iul su "Modulo 3 – Metodi di ricerca per la comunicazione Analisi bivariata". Il Pdf, una presentazione universitaria, esplora concetti chiave come correlazioni spurie, intervalli di confidenza e significatività statistica, utili per lo studio della metodologia della ricerca.
Mostra di più17 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
IUL UNIVERSITÀ TELEMATICA DEGLI STUDI Tabelle (o tavole) di contingenza · Il modo più semplice per rappresentare le relazioni tra due variabili categoriali consiste nell'utilizzare le tabelle (o tavole) di contingenza Tabelle a doppia entrata (una variabile sulle righe, l'altra sulle colonne) Mostrano le frequenze congiunte per le due variabili N.B .: NON utilizzare tabelle di contingenza con variabili cardinali (scala) @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Tabelle di contingenza: esempio · Ipotesi: c'è una relazione tra età e uso dei social media · Usiamo due variabili categoriali per testarla: · Se gli intervistati utilizzano una o più piattaforme social Se gli intervistati hanno più o meno di 40 anni · Questa tabella sembra supportare la nostra ipotesi Under 40 Over 40 Non usa i social 1 (6.7%) 8 (53.3%) Usa una piattaforma 4 (26.7%) 4 (26.7%) Usa più di una piattaforma 10 (66.6%) 3 (20%) TOTALE 15 (100%) 15(100%) @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Ma .... · La tabella di contingenza sembra evidenziare una differenza tra due gruppi, ovvero gli under 40 sono più propensi a utilizzare più piattaforme di social media rispetto agli over 40 Tuttavia: Abbiamo scoperto una reale differenza tra gruppi indipendenti (under e over 40), oppure questi risultati sono stati ottenuti per caso? La differenza tra i gruppi è abbastanza grande da non poter essere emersa per caso? Test del Chi quadrato: confronta i valori ottenuti per il nostro campione con i valori attesi se non ci fosse alcuna relazione tra variabili @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Chi quadrato · Domanda di ricerca: l'uso dei social varia in base all'età? 1. Ipotesi nulla: non c'è differenza tra il livello di utilizzo dei social da parte di intervistati under e over 40 Ipotesi alternativa: c'è una differenza tra il livello di utilizzo dei social da parte di intervistati under e over 40 (cioè l'età e l'uso dei social sono collegati) · Test del chi-quadrato: confronta i valori osservati con i valori per un'ipotetica "distribuzione uniforme" in cui tutto è uguale Valori ipotetici (E) Under 40 Over 40 Non usa i social 5 5 Usa una piattaforma 5 5 Usa più di una piattaforma 5 5 Valori osservati (O) Under 40 Over 40 Non usa i social 1 8 Usa una piattaforma 4 4 Usa più di una piattaforma 10 3 @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Risultati del Chi quadrato · Chi-quadrato: la somma delle differenze tra il valore osservato (O) e il valore atteso (E) in ciascuna cella al quadrato , divisa per il valore previsto (E) in ciascuna cella x2 = > (0-E)2 E . Per il nostro esempio: Chi-quadrato = 11,2 Come interpretare questo numero che di per sé non significa nulla? Abbiamo bisogno di confrontare il nostro valore del Chi Quadrato con un "valore critico" che ci dirà se la differenza tra i valori osservati e attesi era sufficientemente grande per essere semplicemente dovuta al caso @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Gradi di libertà Intervallo di confidenza DF 90% 95% 99% 1 2.706 3.841 6.635 2 4.605 5.991 9.210 3 6.251 7.815 11.345 4 7.779 9.488 13.277 5 9.236 11.070 15.086 6 10.645 12.592 16.812 7 12.017 14.067 18.475 8 13.362 15.507 20.090 9 14.684 16.919 21.666 10 15.987 18.307 23.209 @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Presentare il Chi square "I rispondenti under 40 sono statisticamente più propensi a usare le piattaforme social degli over 40 (Chi-square (5): 11.2)" N.B.: Condizioni necessarie per il test del Chi quadrato: · Confronto tra due gruppi Variabili categoriali Campione probabilistico (se vogliamo generalizzare i risultati) La frequenza (valore) prevista in ciascuna casella non deve essere troppo piccola (non inferiore a 5) . Il Chi quadrato ci dice se c'è una relazione tra variabili, ma non misura la forza della relazione @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Correlazione I Esiste una relazione tra due variabili di scala? · I coefficienti di correlazione misurano la forza dell'associazione tra due variabili I coefficienti di correlazione NON esprimono causalità In altre parole, indica la probabilità che i valori di una variabile varino quando i valori dell'altra variabile variano @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Coefficiente di correlazione · Il coefficiente di correlazione («r» di Pearson) è compreso tra -1 (relazione negativa tra variabili) e 1 (relazione positiva); 0 indica l'assenza di relazione tra le variabili Visivamente, i coefficienti di correlazione descrivono la probabilità che una linea retta rappresenti la relazione tra due variabili @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Esempio: Altezza e salto in lungo · C'è una relazione tra le variabili? Se sì, è positiva o negativa? Si tratta di risultati statisticamente significativi? È una relazione forte? Merita di essere discussa nel rapporto di ricerca? Altezza Salto (distanza) Altezza Pearson's r p-value -- .777 ** -- .05 Salto (distanza) Pearson's r p-value -- -- -- -- [ In generale: r di Pearson >0,6 e oltre: relazione importante; >0,85: relazione forte (solitamente livello di confidenza del 95%). @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Attenzione: correlazioni spurie · Due variabili sembrano essere correlate, ma in realtà non lo sono Ad esempio, vendite di stufette elettriche - numero di incidenti stradali Nelle correlazioni spurie c'è una terza variabile che spiega le variazioni in entrambe le variabili che sembrano essere correlate: questa è chiamata "variabile confondente" Ad esempio, freddo e strade ghiacciate influenzano sia la vendita di stufe elettriche, sia il numero di incidenti stradali @Tutti i diritti riservatiJUL
UNIVERSITÀ TELEMATICA DEGLI STUDI Risultati rilevanti · Intervallo di confidenza: misura la probabilità che i nostri risultati contengano i valori reali della popolazione di interesse (generalmente 95%) Significatività: indica la probabilità che abbiamo identificato una relazione reale (ad es. differenze tra gruppi) e i nostri risultati non sono dovuti al caso (tipicamente impostato a 0,05 o inferiore) I risultati statisticamente significativi sono generalizzabili alla popolazione, ma ... · Non tutti i risultati statisticamente significativi sono rilevanti Non tutti i risultati rilevanti sono statisticamente significativi @Tutti i diritti riservatiGrazie per l'attenzione! IUL UNIVERSITÀ TELEMATICA DEGLI STUDI @Tutti i diritti riservati