Documento dall'Università degli Studi di Ferrara su Statistica, Lezione 1. Il Pdf introduce la statistica in medicina, distinguendo tra descrittiva e inferenziale, e illustra la raccolta, analisi e interpretazione dei dati. Questo documento di livello universitario, sebbene la materia sia Altro, offre una chiara comprensione dei concetti fondamentali.
Mostra di più14 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
Statistica, Lezione 1, 04/04/2024 Prof: Danila Azzolina STATISTICA Introduzione La statistica in medicina assume una valenza che, nella ricerca sperimentale applicata, è molto importante. Ci può servire per quantificare gli effetti dei farmaci, oppure per quantificare il concetto di rischio per il paziente. La prima parte della statistica affrontata è l'analisi semplice, descrittiva ed esplorativa dei dati. Sostanzialmente la statistica, e di conseguenza anche la statistica medica in particolare, si divide in due branche: la statistica descrittiva e la statistica inferenziale.
Che obiettivo ha? Immaginiamo di avere un quesito clinico: vogliamo caratterizzare l'andamento del colesterolo della popolazione di uomini infartuati al miocardio. Quindi con tale obiettivo, per prima cosa, raccogliamo un campione, un insieme di osservazioni sui nostri pazienti. La statistica descrittiva quindi si pone come obiettivo quello di fare in modo che i dati presi sui pazienti ci raccontino qualcosa. L'obiettivo in questa fase è semplicemente quello di sintetizzare le informazioni che provengono dai nostri dati.
Nella maggior parte dei casi, nella ricerca clinica in generale, il dato, l'unità elementare su cui raccogliamo le informazioni, è costituito dal paziente, ovvero la nostra unità d'analisi. Per unità di analisi si intende l'elemento di base su cui raccogliamo il dato (la pressione la prendiamo mediamente sul paziente piuttosto che i parametri ematici eccetera). Tuttavia, l'unità di analisi può essere anche "diversa": noi facciamo sempre riferimento all'unità statistica come paziente, però alcune indagini, soprattutto in campo epidemiologico, possono considerare come unità elementare, per la raccolta del dato, non il singolo paziente ma la famiglia piuttosto che l'ospedale. Immaginiamo di voler effettuare un'analisi per cercare di capire qual è la l'ammontare della spesa sanitaria in posti letto negli ospedali dell'Emilia-Romagna. In quel caso l'unità di analisi non è più il singolo paziente, ma è l'azienda ospedaliera. Quindi, l'obiettivo è quello di sintetizzare il dato, almeno in questa prima fase (nella statistica esplorativa).
Vuol dire che i dati ci devono raccontare un qualcosa sia sulla centralità del fenomeno in media, ma anche su un altro elemento, molto importante in clinica, che è la variabilità casuale. Qualsiasi fenomeno analizziamo sui nostri pazienti è affetto da variabilità. Cioè, l'attitudine di qualsiasi fenomeno a cambiare sulle unità statistiche. Se io andassi a rilevare l'età in un'aula di ragazzi, essendo tutti molto giovani, la variabilità sarebbe contenuta; ma se rilevassi la stessa informazione, ad esempio, sui soggetti residenti che fanno riferimento all'asl di Ferrara, il collettivo sarebbe enorme e ovviamente ci sarebbe maggiore variabilità. Quindi sintetizzare il dato significa capire cosa i dati mi stanno dicendo, sia in media, sia in termini di dispersione di 1variabilità, che è una quantità molto importante anche per la comunicazione del rischio clinico al paziente (poi vedremo perché). Quindi abbiamo concluso che la statistica esplorativa semplicemente sintetizza i dati della nostra indagine, per ora la parte esplorativa di analisi dei dati si ferma qui. Quindi cercare di capire come è connotato un determinato fenomeno: che sia la pressione o che sia il colesterolo cerchiamo solo di descrivere. Questa descrizione la facciamo usando degli strumenti tabellari (tabelle), degli strumenti grafici e anche delle misure di sintesi numerica.
Esiste anche un'altra branca, della statistica: la statistica inferenziale. Nella maggior parte dei casi, soprattutto quando facciamo delle valutazioni sperimentali sull'efficacia di un farmaco, non basta solo descrivere come stanno andando i pazienti, ma l'obiettivo è un po' più ambizioso: cercare di dire se quell'efficacia che abbiamo ipoteticamente visto nel nostro campione, può essere generalizzata a tutta la popolazione. Quindi in questo ambito, la statistica e la statistica medica in particolare, fa un passo avanti: si utilizza la statistica inferenziale. La statistica inferenziale parte dai dati del nostro campione di pazienti, per poi poter generalizzare i risultati a tutta la popolazione. Quindi, minimizzando la probabilità di commettere un errore, dobbiamo poter dire che l'effetto del trattamento osservato sul campione, può essere generalizzabile a tutta la popolazione.
Popolazione obiettivo Popolazione raggiungibile Popolazione osservata Reale e finito Collettivo Potenziale e infinito o virtuale SAE UNIVE 6 LARORE FRU
Partiamo dalla parte esplorativa trattando l'unità statistica. Quando facciamo una qualsiasi ricerca gli elementi metodologici che dobbiamo mettere in imballo per il nostro studio, devono essere tutti ben definiti; e il primo elemento, come dicevamo, nella maggior parte dei casi, negli studi clinici è l'unità statistica, che nella maggior parte dei casi sarà per noi medici il paziente. Tuttavia, abbiamo visto che a seconda dello scopo dell'indagine, l'unità statistica potrebbe essere anche una famiglia (per esempio le indagini multiscopo che fa l'Istat sul benessere delle famiglie). Partiamo assumendo che la nostra unità elementare, su cui raccogliamo il dato, l'unità statistica, sia il paziente. Stabilito ciò, immaginando di dover partire con una con una ricerca clinica, dobbiamo avere chiaro sia su quali unità raccogliere i dati (nella maggior parte dei casi i pazienti) ma anche qual è la cosiddetta popolazione obiettivo (popolazione target). Se ad esempio devo fare un'indagine per valutare il profilo lipidico dei soggetti adulti residenti in Emilia-Romagna, devo capire qual è la mia popolazione di interesse: soggetti in ambo sesso, con età maggiore di 55, senza altre patologie. Quindi su 2questo target di soggetti, che nell'ambito dell'epidemiologia clinica possiamo chiamare criteri di eleggibilità dello studio, io posso costruire il mio studio. Dopo avere definito l'unità di analisi e il target dell'indagine (la popolazione obiettivo) dobbiamo fare una distinzione tra la popolazione obiettivo e la popolazione effettivamente raggiungibile. Ovviamente per motivi economici e per motivi di fattibilità è difficile andare a intervistare oppure andare a raggiungere tutti i soggetti residenti in Emilia-Romagna; quindi, andrò a selezionare un campione ristretto di persone, però l'importante è definire il target del nostro studio.
VARIABILI QUALITATIVE QUANTITATIVE NOMINALI ORDINALI CARDINALI DISCRETE CONTINUE A questo devo rilevare sui pazienti delle "caratteristiche", quelle che si chiamano: variabili. Le variabili sono quelle caratteristiche osservate, che possono presentarsi in maniera diversa sui vari pazienti. Ad esempio, il colesterolo è una caratteristica (variabile), i trigliceridi sono una variabile, oppure anche il genere è una variabile; quindi, tutte le caratteristiche che servono al fine del nostro studio e che prendiamo sui pazienti sono delle variabili. In statistica, la variabile, assume un connotato molto importante non solo dal punto di vista formale matematico ma anche dal punto di vista del modo in cui vengono trattati e interpretati i dati. Lo schema riassuntivo che si fa del tipo di variabili, che possiamo osservare sui nostri pazienti è il seguente: A seconda del livello di possibilità che abbiamo di quantificare, in termini numerici, l'informazione, c'è una distinzione tra variabili qualitative e variabili quantitative. Le variabili quantitative definiscono un attributo sulla statistica, sul paziente, che è direttamente quantificabile. Queste ultime si dividono in: discrete e continue.
Una variabile discreta in ciascun intervallo assume un numero finito di modalità di risposta. Ad esempio, il numero di farmaci assunti dal paziente "x", quanti farmaci ha assunto è un conteggio, cioè un dato che non è frazionabile: 1234. Quindi una variabile discreta assume finiti valori, in ciascun intervallo (cioè tra un farmaco e quattro farmaci assunti).
Esistono anche le variabili continue, anch'esse quantitative: sono sempre delle variabili quantificabili, tuttavia, almeno a livello teorico, possono essere infinitamente frazionabili in ciascun intervallo. Ad esempio, nel body mass index (BMI), nell'indice di massa corporea, nell'altezza o nella temperatura corporea, 3esistono infiniti valori, nel senso che quell'intervallo è infinitamente frazionabile (ad esempio, tra un intervallo di 37-38 di temperatura corporea posso avere: 37,25-37,38 ecc ... ). Ovviamente dal punto di vista pratico, l'infinito sussiste fino a un certo punto. Però quello che sembra una distinzione sterile è importante, perché capire che tipo di dato stiamo trattando, ci serve per capire come analizzarlo e come interpretarlo. Quindi con variabili quantitative abbiamo un tipo di dato quantificabile.
Dall'altro lato le variabili qualitative definiscono un attributo che rileviamo sul paziente e sull'unità di analisi che non è direttamente quantificabile o numerabile, cioè, definisce una qualità, un attributo. Anche qui possiamo costruire delle distinzioni: le variabili qualitative nominali, sono quelle variabili le cui modalità sono caratterizzate da una assenza di qualsiasi tipo di relazione l'una con le altre, ad esempio il colore dei capelli (bruno, biondo, capelli rossi eccetera) oppure il genere (maschio, femmina): non c'è nessuna relazione d'ordine tra queste modalità, sono degli attributi distinti che osserviamo sui soggetti.
Al contrario, le variabili qualitative ordinali sono sì qualitative (e quindi definiscono un attributo), ma presuppongono un certo ordine logico intrinseco, tra le modalità della variabile stessa. Ad esempio, il titolo di studio (scuola elementare, media e superiore), è ovvio che chi ha preso il diploma ha un grado di istruzione maggiore, rispetto a chi ha terminato le scuole medie. Quindi c'è una gradualità di intensità del fenomeno considerato, che è conservata nelle modalità della variabile stessa.
Infine, ci sono le variabili qualitative cardinali, che sono un po' borderline per quanto riguarda la loro definizione. Ad esempio, la classe "Nyha", che definisce la severità dell'intensità dello scompenso cardiaco. Quindi c'è una gradualità anche qui nella modalità della variabile, che va da uno a quattro (come severità dell'intensità); tuttavia, queste sono etichette numeriche (1, 2, 3, 4) non direttamente quantificabili: una severità dello scompenso cardiaco di quattro, mi dice che il paziente sta peggio rispetto a un paziente che ha uno scompenso cardiaco di due, ma non mi dice che l'intensità del fenomeno è esattamente il doppio. Quindi vengono trattate comunque come degli attributi, sono soltanto delle etichette numeriche che definiscono un grado di severità che però non è direttamente quantificabile.
NATURA CARATTERE VARIABILE MODALITÀ/INTENSITÀ Qualitativa binaria (dicotomica) Stato in vita · Vivo · Morto Qualitativo nominale Stato civile · nubile/celibe · coniugato/convivente vedova/o · separato/divorziato/a Qualitativo ordinale Disabilità nessuna . lieve moderata totale Qualitattivo Cardinale Classe NYHA (New York . 1 Heart Associazione, 2 classificazione dello 3 scompenso cardiaco · 4 Quantitativo discreto Numero di farmaci 0, 1, 2, 3, ...... Quantitativo continuo Temperatura corporea (*℃) Qualsiasi numero compreso tra un minimo ed un massimo compatibili per le unità statistiche considerate Peso (kg) Qualsiasi numero compreso tra un minimo ed un massimo compatibili per le unità statistiche considerate Quindi abbiamo iniziato un'indagine: siamo partiti dalle unità di analisi e dalla popolazione obiettivo, abbiamo chiarito che tipo di informazioni e variabili raccogliamo sui pazienti; adesso possiamo iniziare a raccogliere i 4