Documento de Universidad de Castilla-la Mancha sobre Genética Humana: Identificación de Genes de Enfermedades. El Pdf, un material de estudio para universitarios de Biología, aborda la clonación y el estudio de genes patológicos, incluyendo la valoración de patogenicidad de variantes genéticas según criterios ACMG/AMP.
Ver más25 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
Apuntes elaborados por el Prof. Julio Escribano y el Prof. Jose Daniel Aroca Facultad de Medicina de Albacete Universidad de Castilla-La Mancha
1Genética Humana. Módulo 3, tema 6: Identificación de genes de enfermedades.
Uno de los principales objetivos de la genética médica es la identificación de los genes responsables de las enfermedades hereditarias. La identificación de estos genes permite diversas aplicaciones de interés clínico, como la disponibilidad de un diagnóstico genético (que permite el asesoramiento reproductivo en la familia), mejorar el conocimiento de la base molecular de la patología (lo que permite mejorar y personalizar los tratamientos) y en muchas ocasiones es el primer paso para nuevas posibilidades de tratamiento (como las nuevas terapias génicas que se estudiarán en temas posteriores).
Las estrategias generales de identificación de genes patológicos se dividen en dos grandes grupos, según el tipo de herencia, monogénica o compleja, que presentan grandes diferencias en su metodología e interpretación. Las estrategias utilizadas para la identificación de genes responsables de enfermedades (o caracteres) monogénicas suele centrarse en estudios familiares de segregación, mientras que el estudio de la base genética de las enfermedades complejas suele basarse en estudios poblacionales de asociación.
En los últimos años se ha avanzado mucho en la identificación de genes patológicos gracias a desarrollos metodológicos y técnicos que los alumnos estudiarán en este tema, pero antes del año 1980 se habían identificado solo unos pocos genes humanos responsables de enfermedades, casi todas monogénicas. En esta época, los conocimientos de las bases bioquímicas de determinadas patologías permitieron clonar los primeros genes patológicos y abrieron la puerta a los actuales progresos. En los últimos años el desarrollo de las nuevas técnicas de secuenciación masiva ha permitido acelerar enormemente el descubrimiento de nuevos genes. En el caso de las enfermedades monogénicas se han identificado los genes responsables de más de la mitad (63%) de las enfermedades de este tipo que se estima que existen (4537 genes para un total de 7172 enfermedades, OMIM Statistics Oct 2023) , pero las patologías de herencia compleja siguen siendo un reto. Es importante resaltar que las enfermedades hereditarias más comunes son también las más difíciles de estudiar ya que como hemos visto en el tema anterior, suelen estar producidas por la combinación de variantes de múltiples genes, con pequeños efectos individuales sobre la patología, junto con la 2Genética Humana. Módulo 3, tema 6: Identificación de genes de enfermedades. acción de agentes ambientales. También es necesario tener en cuenta que no todos los genes humanos son capaces de producir patologías, ya que la pérdida de función de muchos de ellos puede no tener efecto sobre el fenotipo debido a la existencia de redundancia genética, es decir, la existencia de otros genes que suplen su función biológica.
En el caso de las patologías monogénicas, la alteración de un solo gen es capaz de producir la patología bajo estudio. Para identificar genes patológicos se pueden seguir cuatro estrategias generales que han ido desarrollándose a lo largo de las últimas décadas y que, ordenadas cronológicamente son:
Hasta el desarrollo de las nuevas técnicas de secuenciación masiva la elección de alguna de estas cuatro estrategias dependía de los recursos y del conocimiento sobre la causa de la enfermedad, pero en la actualidad, debido a su gran potencia y facilidad de empleo se utiliza casi de forma exclusiva la secuenciación masiva de exomas o genomas completos.
Esta estrategia, hoy obsoleta, permitió identificar genes causales de enfermedades hereditarias basándose en la función proteica conocida (ej. beta-globina en anemia falciforme o fenilalanina hidroxilasa en fenilcetonuria). Tras purificar la proteína, se determinaba su secuencia de aminoácidos para sintetizar sondas de oligonucleótidos degenerados (mezclas que cubrían codones posibles), marcadas radiactivamente para cribar genotecas de ADNc y posteriormente genómicas. Aunque 3Genética Humana. Módulo 3, tema 6: Identificación de genes de enfermedades. clave en sus inicios, el proceso era extremadamente costoso y laborioso, requiriendo años de esfuerzo por gen.
H2N H2N NH2 Digest with protease COOH COOH COOH Separate peptides NH2 >> COOH COOH COOH NH2 NH2 Protein encoded by gene of interest Sequence by Edman degradation 1 2 3 4 5 6 7 8 9 10 11 12 Phe Leu Cys Ile Tyr Met His Gin Asp Ser Leu Gin Peptide sequence TTĮ СТО TGI TAI ATG CAI CAS GAT TCC CTC CAĞ G · Possible DNA sequence TTÀ AGI TTÀ Least-degenerate 20-base region Prepare 20mer degenerate probe to screen genomic library Perfectly complementary oligonucleotide in the degenerate probe TGCATTTACATGCACCAAGA ... AAGAATACGTAAATGTACGTGGTTCTATCGAATGTC ... Coding sequence
Fig 1. Esquema que ilustra el proceso de clonación funcional destacando la dificultad de predecir la secuencia nucleotídica de un gen a partir de la aminoacídica por la degeneración del código genético.
Esta estrategia permite identificar el gen responsable de la enfermedad a través de la determinación de su localización cromosómica. Para ello se pueden emplear metodologías tales como:
Para identificar el gen causante de una enfermedad mediante esta estrategia se analizan familias afectadas usando marcadores genéticos distribuidos en el genoma. Si un marcador (secuencia variable cuya posición cromosómica es conocida) se transmite 4 T T T TGenética Humana. Módulo 3, tema 6: Identificación de genes de enfermedades. junto con la enfermedad (co-segregación), indica que el gen está cercano (existe ligamiento). Inicialmente, la región identificada abarca millones de pares de bases, por lo que se refina empleando subconjuntos de marcadores más próximos entre sí y localizados en la región previamente acotada. Al delimitar un intervalo pequeño, el número genes candidato ya es manejable y se pueden buscar en ellos mutaciones coincidentes con el patrón hereditario.
La clave de esta estrategia es demostrar ligamiento mediante la frecuencia de recombinación entre loci observada en las familias en las que la enfermedad segrega: menor distancia física implica menor recombinación. Así, una frecuencia de recombinación entre un marcador y una enfermedad de 0.5 (50%) indicaría ausencia de ligamiento (genes muy separados o en cromosomas distintos). Cualquier frecuencia inferior indicaría ligamiento, y este sería más cercano cuanto menos frecuente fuesen las recombinaciones. Cada 1% de recombinación equivale a 1 centiMorgan (cM), ~1 millón de pares de bases (Mb). Así, el análisis de recombinación permite estimar distancias y confirmar la proximidad gen-gen patológico.
Locus of a "disease gene" (a genetic risk factor), D DNA markers that are close enough to a disease gene tend to be inherited together (genetically linked) with the disease gene. DNA markers that are too far from the disease gene in the chromosome (or are in a different chromosome) are not linked to the disease gene. They do not tend to be inherited with the disease gene in pedigrees. 1 D DNA polymorphisms (genetic markers) along the chromosomes The closer a marker is to the disease gene, the closer the linkage and the more likely it is that they will be inherited together.
Fig 2. Localización genética mediante el empleo de marcadores polimórficos. Los marcadores cercanos al locus de interés tienden a heredarse junto con la enfermedad. La localización del gen patogénico se determina utilizando como pista la localización de los marcadores que están ligados a el.
Por tanto la clave es este tipo de estudios es detectar la existencia de recombinación entre los marcadores genéticos y la enfermedad. Para ello necesitamos que los marcadores sean muy polimórficos (haya múltiples alelos presentes en la población), ya que de esta manera será más probable que los sujetos que estudiamos serán heterocigotos para esos marcadores y podamos distinguirlos en la siguiente generación. Los distintos alelos de los marcadores permiten distinguir en un individuo 5Genética Humana. Módulo 3, tema 6: Identificación de genes de enfermedades. qué cromosoma ha sido heredado del padre y que cromosoma procede de la madre. Aunque se estudiara en temas posteriores, la mayoría de marcadores empleados corresponden a secuencias repetidas en tándem de número variable (VNTR) que engloban a los microsatélites y minisatélites estudiados el curso pasado.
¿Cómo podemos saber si un marcador genético y el gen responsable de la enfermedad, cuya herencia estamos estudiando en una o más familias, están ligados? Para ello planteamos distintas hipótesis de ligamiento y las contrastamos con la recombinación real observada en cada familia. Por ejemplo, como primera hipótesis suponemos que están ligados y separados por una distancia tal, que hace que la frecuencia de recombinación sea 0,1, es decir estamos suponiendo deben recombinar un 10% de las veces, por lo que la distancia entre ellos es de 10 cM o de 10 millones de pares de bases. Seguidamente hipotetizamos que no están ligados y volvemos a compararlo con las observaciones reales. Como se ha comentado anteriormente si no están ligados la frecuencia de recombinación es 0,5 (50% de recombinación). El cociente entre estas dos probabilidades, denominado Zx, nos servirá para estimar si estadísticamente existe ligamiento o no a esa distancia propuesta, y lo podemos expresar con las siguientes fórmulas:
Probabilidad de ligamiento (0=x) Z = X Probabilidad de NO ligamiento (0=0,5)
Por convenio se calcula el logaritmo decimal de esta relación de probabilidades y se denomina puntuación LOD (logarithm of the odds, o tambien logarithm of the differences). LODe __= log Z. Una puntuación LOD de 3 se acepta como prueba de ligamiento entre dos loci a una frecuencia de recombinación concreta y nos indica que la probabilidad de ligamiento es 1000 veces superior a la probabilidad de no ligamiento. Por el contrario, un valor inferior a -2 se considera una prueba de que ambos loci no están ligados a esa distancia. Una vez hechos estos cálculos asumiendo una frecuencia de recombinación, analizamos otras hipótesis para evaluar por ejemplo que estén más separados. Para ello asumimos valores de 0 cada vez mayores. En definitiva, cuando se lleva a cabo un análisis de ligamiento, lo normal es probar una serie de valores de 0, y 6