Polimorfismi e mutazioni genetiche: SNP, STR e applicazioni forensi

Slide del Prof. Massimo Negrini su polimorfismi e mutazioni. Il Pdf, utile per studenti universitari di Biologia, esplora le differenze tra SNP e STR, le loro frequenze e le applicazioni in indagini di parentela e forensi, oltre all'uso nei Genome Wide Association Studies.

Mostra di più

15 pagine

Genetica medica, Lezione 02, 07/03/2024
Prof. Massimo Negrini
POLIMORFISMI E MUTAZIONI
Se ci si osserva possiamo dire che ci si riconosce come diversi da ogni individuo.
Queste differenze fenotipiche del nostro aspetto corrispondono a differenze del nostro genoma che con le
tecniche appropriate possono essere messe in evidenza.
Uno degli esempi che ci permette di comprendere tali differenze polimorfiche del DNA è quello di
paragonare il nostro genoma ad un libro.
Il libro (e quindi il genoma) di ogni persona ha esattamente gli stessi capitoli e gli stessi paragrafi disposti
nello stesso ordine e questi libri raccontano sempre la stessa storia.
Tuttavia, all’interno di ciascun libro ci possono essere degli errori diversi.
Noi tutti siamo costituiti alla stessa maniera (con braccia, gambe, ecc…) per cui siamo in grado di
riconoscerci come esseri umani ma siamo anche in grado di riconoscerci come individui diversi.
Queste variazioni sono fondamentali per la genetica, la quale studia queste differenze che possono essere
neutre (polimorfismi) oppure possono essere errori (mutazioni).
Polimorfismi
Il 99,9% del DNA di un individuo è identico al genoma di un altro individuo ma vi è uno 0,1% che li
distingue. Gli unici individui che hanno in comune il 100% del genoma sono i gemelli omozigoti.
I polimorfismi, quindi, sono delle piccole variazioni del DNA che sono molto più evidenti tra popolazioni
diverse ed impattano in maniera marginale sui fenotipi dei vari individui.
Quali sono i polimorfismi presenti nel nostro genoma?
I più frequenti sono due:
1. Cambi di singoli nucleotidi (Single
Nucleotide Polymorphism, SNP): corrisponde
al cambiamento di un singolo nucleotide in
alleli di individui diversi o in alleli diversi dello
stesso individuo.
2. Sequenze ripetute in TANDEM in numero
variabile (Short Tandem Repeat, STR): sono
dovuti a duplicazioni in tandem di piccoli
segmenti (spesso dinucleotidici).
1
Cambi di singoli nucleotidi (Single Nucleotide Polymorphism, SNP)
Sono cambiamenti di singoli nucleotidi che si possono trovare sparsi nel nostro genoma. Queste variazioni
non sono dannose.
Dove sono?
Per rispondere a queste domande esiste un database
(https://www.ncbi.nlm.nih.gov/snp/) dove sono
raccolti tutti i polimorfismi scoperti dall’uomo.
Ogni polimorfismo è identificato da un ID
(rs+numero) rappresentato dalla sua posizione nel
genoma e nel cromosoma, la tipologia di variante,
SNP, dove si trovano queste SNP (introne), se
hanno un effetto fenotipico di interesse clinico e le
frequenze alleliche.
Il professore porta l’esempio del gene CDH4 (gene della Caderina).
Quanti sono i polimorfismi?
In ogni individuo per ogni locus i polimorfismi possibili sono al massimo due, ma nella popolazione generale
sono state complessivamente trovate 150milioni di variazioni di singoli nucleotidi, cioè una variazione ogni
20 nucleotidi.
Sequenze ripetute in TANDEM in numero variabile (Short Tandem Repeat, STR o
Microsatelliti)
Sono corti segmenti di DNA caratterizzati da sequenze ripetute e
ciascuno di questi è delimitato da sequenze uniche; ogni
microsatellite è quindi presente in uno specifico locus del
cromosoma del nostro genoma.
Ogni microsatellite è definito da un codice D+numero S+numero.
Per esempio: D20S312 identifica il microsatellite 312 del
cromosoma 20.
Ciascun microsatellite, poiché può avere lunghezza variabile,
presenta più forme alleliche. Nell’esempio affianco vi sono 4
forme alleliche diverse ma esistono loci con più forme alleliche
differenti.
Gli STR del genoma umano sono oltre 600000. Hanno una
posizione nota e sono facilmente tipizzabili perché ogni allele ha
2

Visualizza gratis il Pdf completo

Registrati per accedere all’intero documento e trasformarlo con l’AI.

Anteprima

Genetica Medica: Polimorfismi e Mutazioni

Genetica medica, Lezione 02, 07/03/2024
Prof. Massimo Negrini

POLIMORFISMI E MUTAZIONI
Se ci si osserva possiamo dire che ci si riconosce come diversi da ogni individuo.
Queste differenze fenotipiche del nostro aspetto corrispondono a differenze del nostro genoma che con le
tecniche appropriate possono essere messe in evidenza.
Uno degli esempi che ci permette di comprendere tali differenze polimorfiche del DNA è quello di
paragonare il nostro genoma ad un libro.
Il libro (e quindi il genoma) di ogni persona ha esattamente gli stessi capitoli e gli stessi paragrafi disposti
nello stesso ordine e questi libri raccontano sempre la stessa storia.
Tuttavia, all'interno di ciascun libro ci possono essere degli errori diversi.
Noi tutti siamo costituiti alla stessa maniera (con braccia, gambe, ecc ... ) per cui siamo in grado di
riconoscerci come esseri umani ma siamo anche in grado di riconoscerci come individui diversi.
Queste variazioni sono fondamentali per la genetica, la quale studia queste differenze che possono essere
neutre (polimorfismi) oppure possono essere errori (mutazioni).

Polimorfismi

Il 99,9% del DNA di un individuo è identico al genoma di un altro individuo ma vi è uno 0,1% che li
distingue. Gli unici individui che hanno in comune il 100% del genoma sono i gemelli omozigoti.
I polimorfismi, quindi, sono delle piccole variazioni del DNA che sono molto più evidenti tra popolazioni
diverse ed impattano in maniera marginale sui fenotipi dei vari individui.

Polimorfismi nel Genoma

Quali sono i polimorfismi presenti nel nostro genoma?
I più frequenti sono due:

  1. Cambi
    di
    singoli
    nucleotidi
    (Single
    Nucleotide Polymorphism, SNP): corrisponde
    al cambiamento di un singolo nucleotide in
    alleli di individui diversi o in alleli diversi dello
    stesso individuo.
  2. Sequenze ripetute in TANDEM in numero
    variabile (Short Tandem Repeat, STR): sono
    dovuti a duplicazioni in tandem di piccoli
    segmenti (spesso dinucleotidici).

Tipologie Comuni di Polimorfismi del DNA

Tipologie comuni di
polimorfismi del DNA

  1. Cambio di un nucleotide
    (Single Nucleotide Polymorphism, SNP)
    ... AAC ACA ACG CCG CGA GAT ...
    ... AAC ATA ACG CAG CGA GAT ...
  2. Sequenze ripetute in TANDEM in numero
    variabile (Short Tandem Repeat, STR)
    ... AAC CA CA CA CA CA CA CA GTT ... (CA) 7 volte
    ... AAC CA CA CA GTT ...
    (CA) 3 volte

Cambi di Singoli Nucleotidi (SNP)

1Cambi di singoli nucleotidi (Single Nucleotide Polymorphism, SNP)
Sono cambiamenti di singoli nucleotidi che si possono trovare sparsi nel nostro genoma. Queste variazioni
non sono dannose.
Dove sono?
Per rispondere a queste domande esiste un database
(https://www.ncbi.nlm.nih.gov/snp/) dove sono
raccolti tutti i polimorfismi scoperti dall'uomo.
Ogni polimorfismo è identificato da un ID
(rs+numero) rappresentato dalla sua posizione nel
genoma e nel cromosoma, la tipologia di variante,
SNP, dove si trovano queste SNP (introne), se
hanno un effetto fenotipico di interesse clinico e le
frequenze alleliche.
Il professore porta l'esempio del gene CDH4 (gene della Caderina).
Quanti sono i polimorfismi?
In ogni individuo per ogni locus i polimorfismi possibili sono al massimo due, ma nella popolazione generale
sono state complessivamente trovate 150milioni di variazioni di singoli nucleotidi, cioè una variazione ogni
20 nucleotidi.

Sequenze Ripetute in Tandem (STR o Microsatelliti)

Sequenze ripetute in TANDEM in numero variabile (Short Tandem Repeat, STR o
Microsatelliti)
Sono corti segmenti di DNA caratterizzati da sequenze ripetute e
ciascuno di questi è delimitato da sequenze uniche; ogni
microsatellite è quindi presente in uno specifico locus del
cromosoma del nostro genoma.
Ogni microsatellite è definito da un codice D+numero S+numero.
Per esempio: D20S312 identifica il microsatellite 312 del
cromosoma 20.
Ciascun microsatellite, poiché può avere lunghezza variabile,
presenta più forme alleliche. Nell'esempio affianco vi sono 4
forme alleliche diverse ma esistono loci con più forme alleliche
differenti.
Gli STR del genoma umano sono oltre 600000. Hanno una
posizione nota e sono facilmente tipizzabili perché ogni allele ha

  • Gli STR del genoma umano sono
    oltre 600.000

D205906 5.81
D209473 10.82
D405916 19.74
D20S115 24.66
D20S188 32.53
DA05163 36.69
D2051140 45.76
51.38
D20$191 54.83
D205843 55.66
DROS834 58.23
D205607 61.27
D20596 66.55
D20SA81 69
D203821 72.46
D20SB69 78.47
D205839 81.95
-
D20$853 87.97
.

  • Sono facilmente tipizzabili e stabili

Microsatelliti sono corti segmenti di DNA caratterizzati dalla
presenza di sequenze ripetute, quali CACACACA.
.
Ciascun microsatellite è delimitato da sequenze uniche e perciò
identifica un punto/locus specifico del nostro genoma,
.
Ogni microsatellite è definito da un codice (ad es. D20S312 =
microsatellite 312 del cromosoma 20)
Ciascun microsatellite presenta diverse forme alleliche. Infatti, la
unità ripetuta (CA) può presentare un numero variabile di ripetizioni
.
Gli STR (Short Tandem Repeats) o microsatelliti presentano perciò alleli
multipli: ad esempio
A1: ... TACAGC CA CA CA CA GCACTT ...
A2: ... TACAGC CA CA CA CA CA GCACTT ...
A3: ... TACAGC CA CA CA CA CA CA GCACTT ...
A4: ... TACAGC CA CA CA CA CA CA CA GCACTT ...

SNPs: NCBI dbSNP

1000G MAP
19961612025
60,770,690
single nucleotide variant
LOC105372699 and 1 more
intron variant
Not Provided
#$1297612170
60,770,69€
single nucleotide variant
LOC105372659 and 1 more
intron variant
18148944055
60,770,695
single nucleotide variant
LOC105372699 and 1 more
intron variant
Not-Provided
T = 0.00439201
rs1245225583
60,770,758
single nucleotide variant
LOC105372699 and 1 more
intron variant
Nat-Provided
r$534902209
60,770,763
single nucleotide variant
LOC105372699 and 2 more
Intron variant
Nat-Provided
4 - 0.000199681
r$553149525
60,770.765
single nucleotide variant
LOC195372699 and 1 more
intran wanast
Nat-Provided
C-0.000599042
96027811
60,770,758
single nucleotide variant
LOC105372699 and 1 more
intron variant
Nat-Provided
A = 0.496406
731308227135
60,770,790
single nucleotide variant
LOC105372699 and 1 more
niran variant
Nat-Provided
http://www.ncbi.nlm.nih.gov/SNP/index.html
https://www.ncbi.nlm.nih.gov/variation/view/
SNPs: NCBI dbSNP
È possibile riconoscere tutti gli SNPs associati a ciascun gene o
regioni intergeniche. Qui ad esempio CDH4
Variation Viewer
Homo sapiens: GRChi8.pt# (G/CF_000001485.38) Chr 20 (NC_000820. 11): 60,PT0.42 - 62.412.481
-
---
--
Variant
Location
Wariant type
Molecular consequences
Most severe clinical significance

  • Hanno una posizione nota e
    stabile nel genoma
    D20S904 41.57
  • Sono altamente polimorfici per la
    presenza di multipli alleli
  • Questi marcatori polimorfici sono
    stati usati per ottenere la prima
    mappa genetica del genoma
    umano

D20S913 85.43
2una lunghezza diversa. Gli STR sono stati utilizzati pe realizzare la prima mappa genetica del genoma
umano. Oggi le mappe genetiche risultano obsolete vista la nascita del sequenziamento del DNA.
Una mappa genetica consente di ordinare i polimorfismi su ciascun cromosoma.

Differenze tra SNP e STR

Frequenze Alleliche

Frequenze alleliche
Oltre al fatto che gli SNP sono variazioni di singoli nucleotidi e
generalmente hanno due alleli più frequenti. Nell'esempio accanto
l'allele 1 è caratterizzato dalla presenza di una C nel 40% della
popolazione, mentre l'allele 2 è caratterizzato dalla presenza di una
T nel 60% della popolazione.
Differenze tra SNP e STR:
Frequenze alleliche

  • Gli SNP (Single Nucleotide Polymophisms) presentano
    generalmente solo due alleli nella popolazione: ad
    esempio
    A1: ... AAC ACA ACG ...
    A2: ... AAC ATA ACG ...
    Frequenza Allelica = 40%
    Frequenza Allelica = 60%
  • Gli STR (Short Tandem Repeats) o microsatelliti
    presentano alleli multipli: ad esempio
    A1: ... AAC CA CA CA CA GTT ...
    FA = 30%
    A2: ... AAC CA CA CA CA CA GTT ...
    FA = 30%
    A3: ... AAC CA CA CA CA CA CA GTT ...
    FA = 25%
    A4: ... AAC CA CA CA CA CA CA CA GTT ...
    FA = 15%

Gli STR hanno molteplici alleli, per cui (sempre considerando l'esempio accanto) l'allele 1 ha una frequenza
allelica del 30%, l'allele 2 ha una FA del 30% e così via ...

Frequenze Genotipiche

Frequenze genotipiche
L'eterozigosi nella popolazione è diversa se parliamo di SNP o
se parliamo di microsatelliti.
Esempio: considerando gli alleli A1 e A2 di quel determinato
locus, il 48% della popolazione è eterozigote mentre il 52% è
omozigote. Di questo 52% di omozigoti il 16% è omozigote per
l'allele A1, mentre il 36% è omozigote per l'allele A2.
Differenze tra SNP e STR:
Frequenze genotipiche
ALLELI
GENOTIPI

  • SNPs
    A1
    A2
    52% omozigoti
    A1: 40%
    A2: 60%
    A1
    0,16
    0,24
    48% eterozigoti
  • Microsatelliti
    A1
    A2
    A3
    A4
    A1: 30%
    A1
    9%
    9%
    8%
    5%
    A2
    9%
    9%
    8%
    5%
    A2: 30%
    A3
    8%
    8%
    6%
    4%
    A3: 25%
    A4
    5%
    5%
    4%
    2%
    A4: 15%
    26% omozigoti
    74% eterozigoti

Per il loro multi-allelismo, i microsatelliti hanno alto tasso di eterozigosi nella popolazione e
perciò molto più informativi per studi di linkage o di associazione
Osservando invece i microsatelliti e facendone tutte le combinazioni possibili otteniamo il 26% di omozigoti
e il 74% di eterozigoti.
L'eterozigosi dei polimorfismi è il metodo che si sfrutta per fare diverse indagini genetiche.

Deriva Genetica in Europa

Deriva genetica in Europa
Se andiamo a vedere i polimorfismi presenti nel genoma
degli individui di varie nazionalità europee notiamo che
ogniuno di questi popoli presenta degli allelotipi, cioè delle
combinazioni di alleli tipiche di alcune popolazioni.
Deriva genetica in Europa

  • In Europa si distinguono
    diverse popolazioni dal
    punto di vista genetico,
    cioè per la combinazione di
    polimorfismi genetici o
    allelotipi
  • Queste popolazioni si
    sovrappongono alla
    distribuzione geografica
  • Presumibilmente retaggio
    di deriva genetica da
    migrazione

Genes mirror geography within Europe
3
A2
0.24
0.36In uno studio pubblicato su Nature nel 2008 si vede come per
ogni popolazione vi siano degli allelotipi tipici.

1000 Genomes Project

1000 Genomes Project

  • 1000 Genomes Project è uno studio internazionale con l'obiettivo principale di
    creare un catalogo completo e dettagliato delle variazioni genetiche presenti
    nel genoma umano proveniente da diverse popolazioni e aree geografiche.
  • Scoprire > 95% delle varianti (ad esempio SNP, CNV, indels)
  • Definire le frequenze degli alleli
    Identificare eventuali fenomeni di «linkage disequilibrium» nelle diverse
    popolazioni mondiali
  • Utilizzabile per studi
    di associazione
    relativi a variazioni
    genetiche nelle
    malattie dell'uomo.

population bore the b000 Genomes Project:

Applicazioni dei Polimorfismi

Indagini di Parentela

A cosa servono i polimorfismi?
Indagini di parentela
I polimorfismi più frequenti usati per questi studi sono i
microsatelliti perché sono frequentemente eterozigoti nella
popolazione e perché, come detto prima, possono essere
tipizzati facilmente vista la lunghezza diversa degli alleli.
I polimorfismi vengono usati per le analisi di tipo familiare
(analisi di paternità).
Nell'esempio accanto, per un determiato locus il padre ha
A1 / A3
A1 / A2
A2 / A2
A1/A2
FIGLIO 2
gli alleli A1/A2 mentre la madre gli alleli A2/A3. Il figlio

  • Analisi di paternità
  • Analisi di parentela

FIGLIO 3
A2 / A2
1 ha l'allele Al che certamente deriva dal padre e l'A3
dalla madre, il filgio 2 ha l'allele Al che deriva dal padre l'A2 dalla madre e il figlio 3 è omozigote per
l'allele A2 che derivano sia dalla madre che dal padre.
In questo caso abbiamo un pedigree assolutamente normale in cui la trasmissione degli allei derivano per
metà dalla madre e per metà dal padre.

Indagini Forensi

Indagini forensi
I polimorfismi vengono usati anche nelle indagini forensi.
Nell'esempio accanto (indagine criminale) si è raccolto del
materiale genetico e si è visto che il locus A presenta gli
alleli A1 e A2, mentre il locus B presenta gli alleli B1 e
B2. Vengono analizzati i DNA di due individui sospetti di
aver commesso il crimine. In base a questo il sospetto 2
può essere escluso perché i polimorfismi del suo DNA
sono diversi dai polimorfismi del DNA delle evidenze
forensi.
Polimorfismi del DNA impiegati nella
tipizzazione di reperti in indagini forensi
Le analisi forensi del DNA fanno uso di polimorfismi del DNA per la tipizzazione del DNA e
vengono utilizzate per:
identificare possibili stupratori e altri criminali;
PHUFHI
UOZHROZ
Nell'esempio a fianco, sono stati utilizzati due marcatori genetici (A e B); uno che rivela le
bande alleliche in alto, l'altro bande alleliche in basso.

  1. (VICTIM) DNA della vittima stessa;
  2. (EVIDENCE n. 1) DNA dallo sperma rimosso dalla vagina della vittima;
  3. (EVIDENCE n. 2) DNA della macchia di seme lasciato sui vestiti della vittima;
  4. (SUSPECT # 1) DNA del sospetto 1;
  5. (SUSPECT # 2) DNA del sospetto 2;

Alleli locus A

  1. (MARKER) un insieme di frammenti di DNA di lunghezza nota.
  2. (CONTROL) DNA di una persona precedentemente testata per assicurarsi che le
    sonde funzionino correttamente.

In base a questo test, il sospetto n. 2 può essere chiaramente escluso.
Ma il sospetto n. 1 è colpevole?
La probabilità della combinazione allelica osservata nel genotipo dipende dalle
.
frequenze alleliche nella popolazione
Frequenza genotipo
Ad esempio:
A1 / A2 = 2 x 0,25 x 0,2 = 0,10
Frequenze Alleliche: A1= 25%; A2= 20%
Frequenze Alleliche: B1= 10%; B2= 40%
B1 / B2 = 2 x 0,1 x 0,4 = 0,08
A1/A2 B1/B2 = 0,1 x 0,08 = 0.008 = 0,8%
La probabilità di abbinamento casuale: si ottiene moltiplicando
Frequenza
Frequenza
Genotipo
Evidenza
0.80% X 0.80%
0.0064%
Genotipo
Sospetto 1
1 possibilità su 15,625
Il sospetto 1 ha invece esattamente gli stessi polimorfismi.
A questo punto il Professore suggerisce di dare un'occhiata ai calcoli della diapositiva per verificare la
veridicità del risultato del test.

Analisi Familiare

Analisi familiare
Sebbene nella popolazione i
microsatelliti presentino multipli alleli,
A1 A2
A
A1 / A2
PADRE
414
MADRE
A2 / A3
Impiegati per analisi di pedigree familiari
Az / A3
A1 / A2
A1 / A3
FIGLIO 1
2
3
WPHANZUNA
W>HOWZUR
A1
Alleli locus B
4
Origine dei genomi sequenziati
Di questo pool allelico, ogni individuo ne
presenta ovviamente non più di due

Non hai trovato quello che cercavi?

Esplora altri argomenti nella Algor library o crea direttamente i tuoi materiali con l’AI.