Epidemiologia sperimentale e statistica biomedica: basi e applicazioni

Documento di Maria Elena Flacco su epidemiologia sperimentale e statistica biomedica. Il Pdf esplora concetti fondamentali come tipi di variabili, misure di tendenza centrale e dispersione, e il range interquartile, utile per lo studio universitario di Biologia.

Mostra di più

25 pagine

1
EPIDEMIOLOGIA SPERIMENTALE
Maria Elena Flacco
Statistica applicata alla ricerca biomedica: Basi e Applicazioni
TRASLAZIONALE= Applicare alla pratica clinica le evidenze scientifiche.
Spesso si sente dire “il tal alimento fa bene”, o “fa male”, quando va bene, si leggono frasi del tipo “il
tal alimento, o condizione, è associato ad un rischio maggiore del 20% della tal malattia”.
Ma queste affermazioni hanno realmente senso?
Importanza di quantificare
Importanza di distinguere il rischio assoluto dal rischio relativo
Per identificare un’evidenza come EBM è importante quantificare.
I concetti fondamentali:
Tipo di variabile: Tutto ciò che noi possiamo misurare. Possono essere CONTINUE e
CATEGORICHE (dicotomiche, discrete, ordinali).
VARIABILI CONTINUE: Quando può assumere, almeno in teoria, tutti i valori compresi in
un intervallo reale o, in altri termini, può assumere una infininon numerabile di valori diversi.
o Distribuzione di frequenza: Normale (Gaussiana, di Bell, parametrica o omogenea),
utilizzata per i fenomeni biologici; “skewed” (asimmetrica o non parametrica o
disomogenea), utilizzata per i fattori sociali.
o Misure di tendenza centrale: Media, mediana e moda.
La moda è il valore che ricorre con frequenza maggiore, la mediana o 50° percentile
è il valore al di sotto del quale cade la metà dei dati, viene utilizzata soprattutto quando
la distribuzione dei dati è disomogenea, e spesso questi fenomeno sono quelli sociali,
la media è la somma dei dati/numero dei dati, la media è molto influenzata dai valore
estremi, non andrà quindi bene se io devo calcolare la media di osservazioni con valori
molto estremi, in quanto tenderà ad essere troppo influenzata da essi. Nel caso in cui
dovesse esserci una raccolta dati di un’osservazione di una variabile biologica, nel caso
di valori che influenzano la media in maniera esponenziale, ricontrollare se questi valori
hanno una giustificazione biologica, nel caso in cui siano errori, sostituirli con i valori
giusti se possibile reperirli, sostituirli con la media se non possono essere reperiti o
lasciarli come valori mancanti.
o Misure di dispersione: Un indice di dispersione è un indice che descrive sinteticamente
la variabilità di una distribuzione statistica quantitativa. In modo particolare misura
quanto i valori presenti nella distribuzione distano da un valore centrale scelto come
riferimento. Il valore centrale è solitamente un indice di posizione. I valori centrali più
usati nelle applicazioni sono media e mediana.
La deviazione standard o scarto quadratico medio è
una misura di dispersione statistica che quantifica la
variabilità o la propagazione di un insieme di dati.
Fornisce un'indicazione di quanto i valori di un insieme
si discostino dalla loro media aritmetica. In altre parole,
lo scarto quadratico medio è uno strumento che aiuta a
capire quanto i dati siano "sparsi" o "raggruppati"
intorno al valore medio. Valore che, aggiunto o sottratto
alla media, comprende il 68% (2/3) delle osservazioni. In questi casi vengono spesso
fatte le analisi stratificate ovvero la separazione dei pazienti o l’analisi dei risultati in
2
base a criteri diversi dal trattamento somministrato, ad esempio per età o per genere.
Da utilizzare sempre quando la distribuzione è normale.
Il range interquartile è quel valore che, se sommato o
sottratto alla mediana mi identifica il 50% delle
misurazioni. In statistica lo scarto interquartile (o
differenza interquartile o ampiezza interquartile, in inglese
interquartile range o IQR) è la differenza tra il terzo e il
primo quartile, ovvero l'ampiezza della fascia di valori che
contiene la metà "centrale" dei valori osservati. La
differenza interquartile viene calcolata semplicemente
sottraendo il punteggio corrispondente alla posizione del venticinquesimo percentile
(denominato primo quartile o Q1) dal punteggio corrispondente alla posizione del
settantacinquesimo percentile (il terzo quartile o Q3). Utilizzato quando una
distribuzione non è normale.
Le variabili Continue come il BMI possono essere trasformate in variabili Categoriche dicotomiche
assegnandole un valore soglia, questo metodo viene utilizzato anche nella creazione Linee Guida. Il
valore del cut-off impostato come valore soglia è il fulcro della Linea Guida, in quanto va a
discriminare chi sarà incluso e chi escluso dalla linee guida e quindi dalla pratica clinica. Andrà ad
influire sui costi della medicalizzazione etc.
VARIABILI CATEGORICHE: Vengono espresse sotto forma di numero assoluto e/o
percentuale.
o Dicotomiche: Variabile aleatoria, nominale che può assumere soltanto uno tra due
valori.
o Discrete: Variabile quantitativa, sono rappresentate dai numeri interi (tipo 1, 356, o 9)
che per la loro natura non possono essere divisi.
o Ordinali: Quando il carattere (statistico) assume stati discreti ma ordinabili abbiamo
una variabile ordinale, quale ad esempio la variabile “Titolo di studio” con tre modalità
disposte in ordine crescente: licenza media inferiore, diploma e laurea.
o Misure di frequenza: L'incidenza e la prevalenza sono due importanti misure di
frequenza negli studi epidemiologici. La prevalenza
misura la proporzione di "eventi" presenti in una
popolazione in un dato momento. Per "evento" si intende
un qualsiasi carattere ricercato; l'incidenza misura la
proporzione di "nuovi eventi" che si verificano in una
popolazione in un dato lasso di tempo. Anche in questo
caso, per "evento" si può intendere la comparsa di un
qualsiasi carattere.
INCIDENZA=RISCHIO ASSOLUTO
o Misure di associazione: Il rischio relativo (RR)
(anche detto relative risk, hazard ratio o risk ratio) è il
rapporto tra la probabili che si verifichi un evento in un gruppo esposto ad un

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

EPIDEMIOLOGIA SPERIMENTALE

Maria Elena Flacco Statistica applicata alla ricerca biomedica: Basi e Applicazioni

TRASLAZIONALE= Applicare alla pratica clinica le evidenze scientifiche. Spesso si sente dire "il tal alimento fa bene", o "fa male", quando va bene, si leggono frasi del tipo "il tal alimento, o condizione, è associato ad un rischio maggiore del 20% della tal malattia". Ma queste affermazioni hanno realmente senso?

Importanza di quantificare

Importanza di distinguere il rischio assoluto dal rischio relativo

Per identificare un'evidenza come EBM è importante quantificare.

I concetti fondamentali

Tipo di variabile: Tutto ciò che noi possiamo misurare. Possono essere CONTINUE e CATEGORICHE (dicotomiche, discrete, ordinali).

VARIABILI CONTINUE

Quando può assumere, almeno in teoria, tutti i valori compresi in un intervallo reale o, in altri termini, può assumere una infinità non numerabile di valori diversi.

Distribuzione di frequenza

Normale (Gaussiana, di Bell, parametrica o omogenea), utilizzata per i fenomeni biologici; "skewed" (asimmetrica o non parametrica o disomogenea), utilizzata per i fattori sociali.

Misure di tendenza centrale

Media, mediana e moda. La moda è il valore che ricorre con frequenza maggiore, la mediana o 50° percentile è il valore al di sotto del quale cade la metà dei dati, viene utilizzata soprattutto quando la distribuzione dei dati è disomogenea, e spesso questi fenomeno sono quelli sociali, la media è la somma dei dati/numero dei dati, la media è molto influenzata dai valore estremi, non андrà quindi bene se io devo calcolare la media di osservazioni con valori molto estremi, in quanto tenderà ad essere troppo influenzata da essi. Nel caso in cui dovesse esserci una raccolta dati di un'osservazione di una variabile biologica, nel caso di valori che influenzano la media in maniera esponenziale, ricontrollare se questi valori hanno una giustificazione biologica, nel caso in cui siano errori, sostituirli con i valori giusti se possibile reperirli, sostituirli con la media se non possono essere reperiti o lasciarli come valori mancanti.

Misure di dispersione

Un indice di dispersione è un indice che descrive sinteticamente la variabilità di una distribuzione statistica quantitativa. In modo particolare misura quanto i valori presenti nella distribuzione distano da un valore centrale scelto come riferimento. Il valore centrale è solitamente un indice di posizione. I valori centrali più usati nelle applicazioni sono media e mediana.

-40 -30 La deviazione standard o scarto quadratico medio è una misura di dispersione statistica che quantifica la variabilità o la propagazione di un insieme di dati. Fornisce un'indicazione di quanto i valori di un insieme si discostino dalla loro media aritmetica. In altre parole, -20 20 30 4g lo scarto quadratico medio è uno strumento che aiuta a 1 68,27% 95,45% capire quanto i dati siano "sparsi" o "raggruppati" 99,73% intorno al valore medio. Valore che, aggiunto o sottratto alla media, comprende il 68% (2/3) delle osservazioni. In questi casi vengono spesso fatte le analisi stratificate ovvero la separazione dei pazienti o l'analisi dei risultati in 1base a criteri diversi dal trattamento somministrato, ad esempio per età o per genere. Da utilizzare sempre quando la distribuzione è normale.

25% Q1 Scribbr Il range interquartile è quel valore che, se sommato o Interquartile range sottratto alla mediana mi identifica il 50% delle misurazioni. In statistica lo scarto interquartile (o differenza interquartile o ampiezza interquartile, in inglese 25% 25% 25% interquartile range o IQR) è la differenza tra il terzo e il Q2 Q3 primo quartile, ovvero l'ampiezza della fascia di valori che Median contiene la metà "centrale" dei valori osservati. La differenza interquartile viene calcolata semplicemente sottraendo il punteggio corrispondente alla posizione del venticinquesimo percentile (denominato primo quartile o Q1) dal punteggio corrispondente alla posizione del settantacinquesimo percentile (il terzo quartile o Q3). Utilizzato quando una distribuzione non è normale.

Le variabili Continue come il BMI possono essere trasformate in variabili Categoriche dicotomiche assegnandole un valore soglia, questo metodo viene utilizzato anche nella creazione Linee Guida. Il valore del cut-off impostato come valore soglia è il fulcro della Linea Guida, in quanto va a discriminare chi sarà incluso e chi escluso dalla linee guida e quindi dalla pratica clinica. Andrà ad influire sui costi della medicalizzazione etc.

VARIABILI CATEGORICHE

Vengono espresse sotto forma di numero assoluto e/o percentuale.

Dicotomiche

Variabile aleatoria, nominale che può assumere soltanto uno tra due valori.

Discrete

Variabile quantitativa, sono rappresentate dai numeri interi (tipo 1, 356, o 9) che per la loro natura non possono essere divisi.

Ordinali

Quando il carattere (statistico) assume stati discreti ma ordinabili abbiamo una variabile ordinale, quale ad esempio la variabile "Titolo di studio" con tre modalità disposte in ordine crescente: licenza media inferiore, diploma e laurea.

Misure di frequenza

L'incidenza e la prevalenza sono due importanti misure di frequenza negli studi epidemiologici. La prevalenza misura la proporzione di "eventi" presenti in una popolazione in un dato momento. Per "evento" si intende un qualsiasi carattere ricercato; l'incidenza misura la proporzione di "nuovi eventi" che si verificano in una popolazione in un dato lasso di tempo. Anche in questo caso, per "evento" si può intendere la comparsa di un qualsiasi carattere.

Numero dei casi di malattia presenti nella popolazione in un dato periodo Prevalenza = Numero totale di individui nella popolazione in quel periodo Numero di nuovi casi di malattia verificatasi durante un dato intervallo di tempo Incidenza = Numero di individui a rischio di ammalarsi (le persone già ammalate si escludono) nella popolazione all'inizio del periodo di tempo considerato

INCIDENZA=RISCHIO ASSOLUTO

Misure di associazione

Il rischio relativo (RR) (anche detto relative risk, hazard ratio o risk ratio) è il rapporto tra la probabilità che si verifichi un evento in un gruppo esposto ad un

2RR = 1 L'ESPOSIZIONE NON E' ASSOCIATA ALLA MALATTIA, NON INFLUENZA LO SVILUPPO DELLA MALATTIA RR > 1 L'ESPOSIZIONE E' ASSOCIATA AD UN MAGGIOR RISCHIO DI MALATTIA - FATTORE DI RISCHIO RR< 1 L'ESPOSIZIONE E' ASSOCIATA AD UN MINOR RISCHIO DI MALATTIA - FATTORE PROTETTIVO trattamento, (ad un fattore di rischio, ad un fattore protettivo), e la probabilità che si verifichi lo stesso evento in un gruppo di non esposti allo stesso trattamento, (fattore di rischio, fattore protettivo). RR= (rischio negli esposti) / (rischio nei non esposti). -- > Rapporto tra due incidenze (Misure di frequenza). Poi il valore che otteniamo va sottratto a 1, e otteniamo il Rischio Relativo. Se moltiplicato per 100 otteniamo il risultato in percentuale.

HAZARD RATIO= L'hazard ratio fornisce un'indicazione relativa di quanto un gruppo sia a rischio rispetto all'altro, nei risultati della ricerca compare con l'acronimo HR. RR ma più preciso. ODDS RATIO = È il rapporto tra la frequenza con la quale un evento si verifica in un gruppo di pazienti e la frequenza con la quale lo stesso evento si verifica in un gruppo di pazienti di controllo. Con una semplificazione estrema si può dire che odds ratio e rischio relativo sono relativamente simili dal punto di vista concettuale (ma dal punto di vista quantitativo lo sono solo per eventi che si verificano raramente). Tende ad estremizzare il significato del RR per risultati superiori all'unità.

  • La metodologia di calcolo in Excel, e la presenza di risultati
  • Variabile: Espressione numerica di una "caratteristica", in senso lato Il modo in cui i dati vengono presentati cambia a seconda del tipo di variabile

STUDIO: Comunicare il rischio: WHI Study

Comunicazione e interpretazione dei dati

Il più grande studio sperimentale per le donne in menopausa. Studio randomizzato che includeva migliaia di donne per confrontare l'efficacia della terapia ormonale sostitutiva versus placebo nelle donne in menopausa. Programmato per durare 8 anni, ci si aspettava che queste donne traessero un beneficio cardiovascolare e oncologico mentre invece fu interrotto dopo 5 perché la terapia ormonale aumentava il rischio di infarti in alcuni tipi di tumore (mammella e endometrio). 14 milioni di donne usavano la terapia ormonale sostitutiva negli USA all'epoca.

3Incidenza infarto nel gruppo terapia ormonale (donne esposte) Incidenza infarto nel gruppo placebo (donne non esposte) Rischio Relativo (RR) Interpretazione del RR Rischio Assoluto 37 / 10.000 30 / 10.000 1.29 Aumento del 29% del rischio di infarto nelle donne in terapia rispetto alle donne sotto placebo (37/10.000) - (30/10.000) 7 casi di infarto in più ogni 10.000 donne

  • L'aumento del rischio di infarto è alto, e induce preoccupazione, tuttavia, in termini assoluti, questo aumento è dello 0.07%!

Incidenza tumore nel gruppo terapia ormonale (donne esposte) Incidenza tumore nel gruppo placebo (donne non esposte) Rischio Relativo (RR) Interpretazione del RR Rischio Assoluto (38/10.000)/(30/10.000) Aumento del 26% del rischio di tumore nelle donne in terapia rispetto alle donne sotto placebo (38/10.000) - (30/10.000) 38 / 10.000 30 / 10.000 1.26 8 casi di tumore in più ogni 10.000 donne

7 . L'aumento del rischio di tumore della mammella è alto, e induce preoccupazione, tuttavia, in termini assoluti, questo aumento è dello 0.08%!

I risultati di questo studio ci dicono che c'era un aumento del 26% (RR) delle donne che sviluppavano un carcinoma alla mammella mentre per quanto riguarda l'infarto del miocardio c'era il RR aumentato del 29%. Per comunicare questa notizia il giornale The New York Times, utilizzano i dati del Rischio Assoluto, invece che i dati del Rischio Relativo. Il risultato in termini di sanità pubblica è stata una profilazione delle donne che chiedono la terapia sostitutiva in maniera molto più precisa. In origine, non esisteva il Rischio Relativo, e si utilizzava esclusivamente l'incidenza (o Rischio Assoluto - RA) per comunicare i risultati. Questo approccio aveva grossi limiti. Ad esempio, quando un professionista sanitario cercava di motivare un fumatore di >50 anni a smettere, comunicandogli che il suo rischio di eventi cardiovascolari maggiori (ictus o infarto) era molto più elevato, forniva i seguenti dati:

  • Se NON fumi, nei prossimi 10 anni, il tuo rischio è circa 3 su 100 *
  • Se fumi, il tuo rischio sarà 6 su 100 In poche parole, il professionista comunicava al soggetto le due incidenze (o rischi assoluti) di ictus/infarto a 10 anni: l'incidenza dei non esposti (non fumatori) e l'incidenza degli esposti (fumatori). Questo approccio è corretto, ma non molto efficace in questo caso, perché, rivedendo i dati:
  • Se NON fumi, probabilità di infarto/ictus 3 su 100
  • Se fumi, probabilità di infarto/ictus 6 su 100 Ci si accorge che si possono interpretare in due modi:

4

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.