Cómo medir la variación genética
Jesús Calle Oyola
Universidad Nacional de Colombia.
Facultad de Ciencias Agrarias
Programa de Maestría en Ciencias Agrarias
14/09/2022
Introducción
Revisión de las medidas más comunes de la variación genética
utilizadas en los estudios genéticos de conservación.
La elección del método analítico depende en parte del tipo de
marcador genético utilizado.
Además, los diferentes aspectos de la variación que se pueden
evaluar dependen de si el marcador está sujeto a selección (no
neutral) o no (siendo selectivamente neutral).
Rasgo RFLP Microsatélites RAPD AFLP Isoenzimas
Origen Anónimo/genético Anónimo Anónimo Anónimo Genico
Número máximo teórico de posibles Limitado por el polimorfismo del sitio Limitado por el tamaño del genoma y Limitado por el tamaño del genoma y Limitado por el polimorfismo del sitio Limitado por la cantidad de genes de
loci en el análisis de restricción (nucleótido) (decenas el número de repeticiones simples en por el polimorfismo de nucleótidos de restricción (nucleótido) (decenas enzimas y ensayos de enzimas
de miles) un genoma (decenas de miles) (decenas de miles) de miles) histoquímicas disponibles (30-50)
Dominio Codominante Codominante Dominante Dominante Codominante
Alelos nulos Raro a extremadamente raro Ocasional a común No aplicable (tipo de detección No aplicable (tipo de detección Extraño
presencia/ausencia) presencia/ausencia)
Transferibilidad a través de géneros Dentro del género o especie Dentro de las especies Dentro de las especies Entre familias y géneros
reproducibilidad alto a muy alto Medio a alto Bajo a medio Medio a alto Muy alto
Cantidad de muestra requerida por 2-10 mg de ADN 10-20 ng de ADN 2-10 ng de ADN 0,2-1 µg de ADN Varios miligramos de tejido
muestra
Facilidad de desarrollo Difícil Difícil Fácil Moderado Moderado
Facilidad de ensayo Difícil Fácil a moderado Fácil a moderado Moderado a difícil Fácil a moderado
Automatización/multiplexación Difícil Posible Posible Posible Difícil
Potencial de mapeo de genoma y QTL Bueno Bueno Muy bueno Muy bueno Limitado
Potencial de mapeo comparativo Bueno Limitado Muy limitado Muy limitado Excelente
Potencial de mapeo de genes Limitado Limitado Inútil Inútil Limitado
candidatos
Potencial para estudiar la variación Limitado Limitado Limitado Limitado Bueno
genética adaptativa
Desarrollo Moderado Caro Barato Moderado Barato
Ensayo Moderado Moderado Barato Moderado a caro Barato
Equipo Moderado Moderado a caro Moderado Moderado a caro Barato
2.1 Variación neutra codominante
Grandes cantidades de tejido
de alta calidad
La variación genética / marcadores genéticos que son
- Aloenzimas
especies en peligro de neutrales o casi neutrales - SSR Codominantes
extinción. - SNP
SNP organismos modelo
Configuración de las frecuencias alélicas observadas en los SNP < tasa de mutación SSR
loci estudiados NO afectada por la selección
Herramientas de análisis
Porcentaje de loci polimórficos Heterocigosidad observada
Un locus podría definirse como monomórfico si la media de las proporciones observadas de heterocigotos H
frecuencia alélica más común es 100, 99 o 95% de o.
todos los alelos muestreados
Coeficiente de consanguinidad
Alelos por locus/riqueza alélica
Heterocigosidad esperada
Heterocigosidad esperada en una población
dadas las frecuencias alélicas observadas
Herramientas de análisis
Diferenciación de poblaciones Flujo de genes
Una especie subdividida en más de una subpoblación, El número de migrantes por generación está
los apareamientos no son aleatorios inversamente relacionado con la diferenciación de la
población tal como:
El grado de diferenciación de la población puede, por lo
tanto, considerarse como un coeficiente de
consanguinidad
H T es la heterocigosidad en todos los poblaciones
H S es la heterocigosidad media en las subpoblaciones
2.2 Marcadores neutrales dominantes
Utiliza cebadores cortos (de 10 a 12 pb de longitud) que se
ADN polimórfico amplificado hibridan aleatoriamente con el ADN objetivo y amplifican el
aleatoriamente (RAPD) ADN colocado entre dos pares de cebadores aleatorios.
Técnica no requiere ningún Es muy sensible a las condiciones de laboratorio y la calidad de
conocimiento del ADN objetivo y que la plantilla de ADN utilizada.
es relativamente económica.
La presencia o ausencia de un producto de amplificación podría
deberse a diferencias entre las secuencias de ADN objetivo o
simplemente a que las muestras difieren en calidad o cantidad
de ADN.
2.2 Marcadores neutrales dominantes
Aprovecha el hecho de que las enzimas de restricción pueden
Polimorfismos de longitud de fragmentos de
cortar el ADN en secuencias diana específicas en todo el
restricción (RFLP)
genoma.
Técnica sencilla y económica Necesita altas concentraciones de ADN de alta
No requiere un conocimiento previo de la secuencia de calidad y el protocolo de laboratorio suele ser muy
ADN objetivo laborioso
2.2 Marcadores neutrales dominantes
las enzimas de restricción cortan el ADN genómico
Ligadura de adaptadores de doble cadena complementarios a los
Polimorfismo de longitud de extremos de los fragmentos de restricción.
fragmento amplificado (AFLP)
Los fragmentos de restricción se amplifican usando cebadores
complementarios a los fragmentos del adaptador y del sitio de
restricción y se visualizan
No requiere ningún conocimiento de las
secuencias de ADN objetivo.
Menos cantidad y calidad de ADN requerido
(PCR) que en los estudios de RFLP.
Producen datos sobre los marcadores dominantes
Métricas como la heterocigosidad, no se pueden calcular
directamente a partir de dichos datos.
Sin embargo, se pueden hacer varios supuestos en los que los
datos dominantes se pueden interpretar y comparar con las
medidas tradicionales.
2.3 Variación de secuencia
Con datos de secuencia seleccionados (no neutrales), la variación se detecta y estudia con
mayor frecuencia en los exones de los genes que codifican proteínas si la sustitución ha
alterado la secuencia de aminoácidos y las propiedades bioquímicas de las proteínas
codificadas.
Las mutaciones silenciosas o sinónimas son cambios genéticos
que no tienen efectos fenotípicos
2.3 Variación de secuencia
Medidas de variación genética con datos de secuencia
Proporción de sitios variables
Se calcula contando el número de sitios variables y segregantes
(S) entre las secuencias muestreadas y dividiéndolo por el
número total de sitios (N)
Diversidad de nucleótidos frecuencias de las
secuencias i y j
Número promedio de diferencias de nucleótidos por sitio entre
dos secuencias elegidas al azar de una población de muestra
proporción de diferentes nucleótidos entre las
secuencias i y j
2.3 Variación de secuencia
Genotipo haploide es un tramo de ADN que se hereda como una
Diversidad de haplotipos
unidad (ADN mitocondrial haploide)
Haplotipos son tramos de ADN en desequilibrio de
ligamiento que no se rompen por recombinación.
La diversidad de haplotipos se define como
Donde fi es la frecuencia del i - ésimo
haplotipo
2.4 Marcadores no neutrales y pruebas de neutralidad
En primer lugar, las pruebas estándar para las desviaciones del equilibrio de Hardy-
Weinberg pueden dar una pista sobre si el lugar geométrico es neutral o no.
Una prueba comúnmente empleada con datos de secuencia es calcular la proporción
de sustituciones no sinónimas (dN) a sustituciones sinónimas (dS ): dN/dS
La D de Tajima es una prueba estadística diseñada para distinguir entre secuencias
de ADN que evolucionan bajo neutralidad y aquellas que evolucionan bajo un
proceso no aleatorio
Variación genética aditiva cuantitativa
Si la influencia ambiental en P es baja y si solo está involucrado un
locus, P=a
Cuantos más loci, más acampanada es la distribución de los valores
fenotípicos.
la varianza del mismo rasgo en una población se puede dividir de la
siguiente manera:
Variación genética aditiva cuantitativa
La heredabilidad ( h 2 ) es la proporción de la varianza en un
rasgo que se debe a efectos genéticos aditivos.
La estimación de la heredabilidad en poblaciones naturales generalmente se
realiza mediante regresiones de padres e hijos o análisis de hermanos.
Componente observacional Convarianza y componentes estimados
sementales V as = Cov (HMedios) = 1/4 V a
presas V ad = Cov (HCompletos) − Cov (HMedios) = 1/4 V a + 1/4 V d + V ec
Descendencias V ap = V p − Cov (HCompletos) = 1/2 V a + 3/4 V d + V ew
Total V T = V pag = V un +V re V ce + V ew
Padres + madres V as + V ad = Cov (HCompletos) = 1/2 V a + 1/4 V d +V ec
Tres estimaciones de h 2
h 2
s =4V as
/V as
+V ad
+V ap No contiene efectos de dominancia.
h 2
d =4V ad
/V as
+V ad
+V ap Tiene dominancia y efectos maternales.
h 2
s+d = 2( V as
+V ad
)/ V as
+V ad
+V ap Tiene dominancia y efectos maternales.
en un locus tenemos las siguientes aptitudes para tres genotipos: w (AA) = 1; w (Aa) = 0,6 y w (aa) = 0,3, y la frecuencia inicial de A
es muy baja, digamos 0,01.
Ilustración del teorema fundamental de Fisher sobre la selección natural. (a) Cambio de frecuencia alélica en
respuesta a la selección. (b) El cambio en la aptitud media en relación con las frecuencias alélicas. (c) Cambio en
la aptitud media y (d) la heredabilidad a lo largo del tiempo (generaciones).