Slide di Università su Errore in Chimica Analitica Sommario. Il Pdf esplora l'errore in chimica analitica, suddividendolo in sistematico, casuale e grossolano, con statistica applicata a piccoli insiemi di dati e test di significatività per la materia Chimica.
Mostra di più48 pagine


Visualizza gratis il Pdf completo
Registrati per accedere all’intero documento e trasformarlo con l’AI.
Le relazioni statistiche valide per una popolazione devono essere corrette se applicate
ad un campione, in modo da prendere in considerazione le possibili discrepanze fra i
dati ottenuti dall'analisi di un campione e quelli della popolazione corrispondente.
Mediante le leggi statistiche è possibile (fra le altre cose):
Come si applica il trattamento statistico dell'errore casuale ai casi reali?
Per ragioni pratiche il numero delle analisi che è possibile effettuare è sempre limitato.
Le informazioni sulla popolazione (l'oggetto ideale dell'analisi) devono pertanto essere
dedotte da un numero piccolo di dati (i risultati delle misure realmente effettuate).
tt
=
Produzione giornaliera di uno stabilimento
farmaceutico (10000 blister da 10 compresse)
Popolazione: contenuti di principio attivo
misurati in ognuna delle 100000 compresse
In termini statistici un piccolo insieme di dati è
un campione. Questo campione non va
confuso con il campione analitico (un
campione statistico è pertanto l'insieme dei
risultati delle analisi effettuate sui replicati di
un campione analitico).
Prelievo per il controllo di qualità della produzione
giornaliera (20 compresse da 20 diversi blister)
Campione: contenuti di principio attivo misurati in
ognuna delle 20 compresse
Perché campione e popolazione sono differenti?
A causa della piccola dimensione un campione non è rappresentativo della popolazione
alla quale appartiene, quindi i suoi parametri (media e deviazione standard) potrebbero non
coincidere con quelli effettivi della popolazione.
Stimare nel miglior modo possibile i parametri di una popolazione a partire dai dati ottenuti
su di un campione è un problema tipico di ogni misura reale.
Popolazione
Distribuzione che
definisce media e
deviazione standard
della popolazione
Campione
Distribuzione che
definisce media e
deviazione standard
del campione
Frequenza
Frequenza
I
I
Valore
Valore
Più piccolo è un insieme di dati (campione), maggiore è il la probabilità che i suoi parametri differiscano
da quelli della popolazione alla quale appartiene. Viceversa, per campioni sufficientemente grandi
(almeno 20 - 30 dati) si può assumere che i parametri di campione e popolazione coincidano.
I parametri calcolati da un campione rappresentano soltanto stime dei valori della
popolazione a cui esso appartiene. Questo comporta fra l'altro l'impiego di definizioni
leggermente differenti.
Grandezza
Popolazione
Campione
Media
μ =
Exi
N
x =
Exi
N
Σ(xi -μ)2
>(xi-X)2
Deviazione standard
0 =
N
S =
N-1
Se N è troppo piccolo, la media del
campione può non coincidere con la
media della popolazione a causa della
non rappresentatività del campione stesso
L'uso del fattore N - 1 (numero di gradi di libertà
dell'insieme di dati) al posto di N nel calcolo della
deviazione standard s del campione porta ad un
incremento del valore, rendendo s una migliore stima di o.
Se non specificato diversamente, nel seguito si farà sempre riferimento a misure effettuate su campioni, quindi si userà la
deviazione standard del campione (s).
Perché nell'analisi di un campione si effettuano più misure?
Da un lato, questo permette di valutare l'errore casuale presente nella misura. Inoltre la
media di un insieme di misure è più affidabile del risultato di una misura singola. Infatti , la
distribuzione statistica delle medie ottenute da un campione di N dati ha una deviazione
standard più bassa rispetto alla Gaussiana che descrive la distribuzione statistica di una
singola misura.
Distribuzione statistica
dei valori di una singola misura x
μ
x
Distribuzioni statistiche dei valori delle medie
di una serie di misure (N1 > N2)
- -
N.
N2
μ
x
Questo risultato è abbastanza intuitivo considerando che
gli errori casuali presenti in un insieme di misure sono in
genere sia positivi che negativi, quindi nella medie di
queste misure essi si elidono almeno parzialmente.
Cosa significa "un campione non è rappresentativo della popolazione"?
"Analisi" di un campione
(10 biglie prelevate casualmente)
2000 biglie
5
5
50% biglie nere
"Analisi" della popolazione
(tutte le 2000 biglie)
4
6
6
4
60% biglie nere
40% biglie nere
3
30% biglie nere
7
7
3
70% biglie nere
2
8
20% biglie nere
8
2
80% biglie nere
9
1
9
10% biglie nere
O
1
90% biglie nere
0
10
10
0% biglie nere
100% biglie nere
0
Meno
probabile
1000
1000
50% biglie nere
Più
probabile
La deviazione standard sm della distribuzione statistica delle medie di un campioni di N dati
(deviazione standard della media) è calcolabile a partire da quella del singolo dato
mediante la
Sm =
s
VN
In contrapposizione a quella del dato singolo,
la deviazione standard della media viene
comunemente indicata come SEM (standard
error of mean).
La media di una serie di misure sperimentali è quindi più precisa di una singola misura e
questo giustifica il suo uso nell'esprimere il risultato.
La deviazione standard della media diminuisce
proporzionalmente alla radice quadrata di N. Se N è
piccolo un aumento del numero di replicati migliora
significativamente l'affidabilità della media. Viceversa, se
N è grande per migliorare l'affidabilità della media è più
conveniente diminuire
s
(Sm
è
direttamente
proporzionale a s)
Sm
s
N
L'analisi dei risultati di un esperimento si dovrebbe basare sui valori reali delle grandezze
in esame. Poiché spesso vengono eseguite poche misure, nell'interpretazione dei dati
sperimentali bisogna però tenere conto anche dell'errore legato alla non rappresentatività
dei campioni.
Ad esempio, due grandezze potrebbero avere lo stesso valore ma
se per ognuna di esse si effettua un numero limitato di misure i
valori effettivamente ottenuti potrebbero essere differenti.
Per trarre conclusioni corrette i dati sperimentali devono essere analizzati mediante un
approccio statistico.
Qual è il valore vero della
grandezza misurata?
> intervallo di fiducia
30
25
Due metodi analitici hanno
la stessa precisione?
> test F
20
Tools statistici per l'interpretazione
10
dei dati sperimentali
5
20
50
100
Due risultati sperimentali
sono identici?
> test t
40
80
Un apparente outlier deve
essere scartato oppure no?
> test G
Quale è il valore vero della grandezza in esame?
A causa della non rappresentatività di un campione, la sua media non coincide con il valore
vero u. E' però possibile definire, a partire dai risultati del campione, un intervallo (intervallo
di fiducia) all'interno del quale dovrebbe trovarsi il valore vero della grandezza (ovvero la
media della popolazione).
Intervallo centrato sulla media del campione (x) all'interno del quale esiste una determinata
probabilità (livello di fiducia) di trovare il valore medio u della popolazione.
Intervallo di fiducia
Valore
x
Livello di fiducia (LF): probabilità di
trovare u all'interno dell'intervallo di fiducia
La definizione di intervallo di
fiducia considera soltanto l'effetto
dell'errore casuale, pertanto non è
più valida in presenza di errore
sistematico.
Il livello di fiducia è un fattore critico per l'ampiezza dell'intervallo di fiducia: livelli di fiducia
più elevati (ovvero maggiori probabilità di trovare u nell'intervallo) causano un aumento
dell'ampiezza.
La scelta del livello di fiducia è un compromesso fra "certezza"
di trovare u nell'intervallo di fiducia e "incertezza" sul suo
effettivo valore (non è possibile avere contemporaneamente
livelli di fiducia elevati e intervalli di fiducia ristretti).
Intervallo di fiducia a LF = 50%
1
Valore
X
x
Intervallo di fiducia a LF = 90%
Valore
x
Intervallo di fiducia a LF = 99%
x
Valore
In alcuni testi vengono usati i termini "livello di
confidenza" ed "intervallo di confidenza".