UNIDAD III
ESTADÍSTICA
APLICADA A LA
GENÉTICA
¡Sólo existe la estadística!
El hombre racional es el hombre estadístico.
¿Será un niño guapo o feo?
¿Sentirá amor por la música?
Sobre todo esto decide un juego de dados.
La estadística está presente en el momento de nuestra concepción, es
ella quien sortea los conglomerados de genes que crean nuestros
cuerpos.
Stanislav Lem
Barbadilla, 2015
A. INTRODUCCIÓN
RELACIÓN ENTRE CIENCIAS
MEJOR COMPRENSIÓN---PROBLEMAS DE LA GENÉTICA
BIOESTADISTICA
MEJORAMIENTO
Distr. Continua Normal Distr. Semicontinua Aprox. Normal
Prod. lechera en 15634 lactaciones. Prolificidad en un grupo de 150 cerdas.
Distr. Discreta Binomial
Fertilidad en un grupo de vacas
Subyacente a la distribución de las observaciones fenotípicas existe:
•Una distribución normal de valores genéticos.
•Un conjunto de influencias ambientales con distribución normal.
La distribución normal
Dos parámetros determinan la forma de la distribución:
•La media, y
•La desviación típica (raíz cuadrada de la varianza 2 = [(x-)2]/n)
1 x
1 ( )2
f ( x) e 2
2
Función de densidad
•A y B difieren en sus medias (4 y 8)
•B y C difieren en sus desviaciones típicas (1
y 0,5)
Relación entre dos variables cuantitativas: correlación
Longitud de cola
y el cuerpo de 18
individuos de la Longitud del 1er
serpiente y 2o molar
Lampropeltis inferior de un
polyzona mamífero
extinto
Número de escalas caudales y longitud de
la cola en las mismas 18 serpientes de ( x x )( y y )
arriba rx , y Correl ( x, y )
n
Cov ( x, y )
var( x) var( y )
Relación entre dos variables cuantitativas: regresión
y bx a
Regresión entre la longitud alar de individuos de Drosophila y la media
de la misma longitud en sus padres. Los valores se han normalizado
como desviaciones de los valores medios
Modelo lineal
Es necesario describir la variación que presenta la variable que se analiza en función de los factores
que afectan dicha variable.
Pesos de animales:
• Sexo de cada uno,
• Edad
• Manejo (nutricional, sanitario, etc.),
Conocer cuánta de la variación en los pesajes se atribuye a cada uno de estos factores, y a
la posible interacción entre los mismos.
Los factores que afectan la expresión de cualquier característica se pueden clasificar en
dos categorías:
Factores genéticos No genéticos.
Constitución genética de los Sexo de los animales, la edad, la
individuos: padres communes. zona o región en donde se
Composición genética (misma raza, encuentren, la época de
línea, estirpe o especie), etc. nacimiento, entre otros.
(Ruales, Manrique, & Cerón, 2007).
El modelo lineal puede definirse de la siguiente manera:
ANÁLISIS DE VARIANZA
En el análisis de varianza se deben tener en cuenta lo siguientes
supuestos:
• Los datos a analizar deben ser aleatorios e independientes.
• Los datos deben provenir de una población con distribución
normal.
• Los datos deben presentar variación homogénea (prueba de
Levene), de acuerdo con las fuentes de variación.
El análisis de varianza se utiliza para separar la variación total entre observaciones en
sus componentes genéticos y no genéticos.
Variación entre grupos y dentro de grupos es la base para la estimación de la
heredabilidad de la característica bajo estudio.
Desde el punto de vista estadístico, el modelo de análisis se puede expresar de la
siguiente manera:
Esquema general de un análisis de varianza para un
modelo lineal.
Ejemplo de estimación de un Análisis de Varianza En la Tabla 2 se presentan los
pesos al destete de terneros Brahman provenientes de 5 padres.
Pesos al destete (Kg) en terneros de la raza Brahman.
2. COMPONENTES DE LA VARIANZA
Donde,
Con los Cuadrados Medios (calculados y esperados) se pueden estimar los
componentes de varianza, así:
Al resolver este sistema de ecuaciones, se obtienen las estimaciones de los
componentes de varianza genético y de entorno:
Al resolver este sistema de ecuaciones, se obtienen las estimaciones de los
componentes de varianza genético y de entorno:
ADEVA
COMPONENTES DE
VARIANZA
PARÁMETROS
GENÉTICOS
3. PARÁMETROS
GENÉTICOS r h2
MAYORES
INCREMENTOS
GENETICOS
Correlaciones Genéticas
Programas de Mejoramiento
Genético
CUALITATIVOS
Determinados por un
Gen (o pocos Genes)
Color de pelambre
Presencia de cuernos
“Booroola”, Doble-musculo
CUANTITATIVOS
Determinados por MULTIPLES
Genes, cada uno de los cuales
aporta “una porción” del valor
total del CARACTER.
LA REPETIBILIDAD (r)
El coeficiente de repetibilidad representa el grado en que una determinada característica se repite
a lo largo del tiempo y sirve para calcular valores productivos y seleccionar en base a ellos.
Animal Lactancia 1 Lactancia 2 Lactancia 3
Baya
150 lt 151 lt 149 lt
Mulata
148 lt 147 lt 148 lt
El valor de una característica de un mismo individuo tiende a repetirse y
depende parcialmente del genotipo, que es constante durante toda la vida del
animal.
Animal Lactancia 1 Lactancia 2 Lactancia 3
Baya
150 lt 151 lt 149 lt
Mulata
148 lt 147 lt 148 lt
Mucho influye la actividad de algunos genes que pueden cambiar con la edad, así
también influencias específicas del medio ambiente.
Por lo tanto la repetibilidad mide la correlación media entre dos producciones de
un mismo individuo.
Animal Lactancia 1 Lactancia 2 Lactancia 3
Baya
150 lt 151 lt 149 lt
Mulata
148 lt 147 lt 148 lt
La varianza de una característica, en diferentes etapas de la vida de un animal puede
ser analizada sobre dos componentes:
1. Varianza dentro de los individuos- mide las diferencias temporales en el
desempeño de un mismo individuo.
Animal Lactancia 1 Lactancia 2 Lactancia 3
Baya
150 lt 151 lt 149 lt
2. Varianza entre individuos- es parcialmente genética y parcialmente ambiental,
tomando en cuanta que la parte ambiental afecta permanentemente a los
individuos durante toda su vida.
VS
ALGUNOS CONCEPTOS DE REPETIBILIDAD
La repetibilidad (r) es la relación entre la varianza del animal para la varianza
fenotípica.
2
r 2
2
2 2 G 2 MP
Efecto Animal=Efecto Genético+Efecto Medio Permanente
La repetibilidad (r) es la fracción de la diferencia del promedio con un registro el cual
se espera se repita en otro registro en el mismo animal.
r
FRECUENCIAS
X x
ESPESOR DE LA GRASA DORSAL mm
La repetibilidad (r) es el coeficiente de regresión del registro subsiguiente en el
registro previo.
r
Registro Subsiguiente
Registro Previo
RANGOS (r)
Baja 0 – 30
Media 31 – 50
Alta > 50
La repetibilidad (r) no es otra cosa que la correlación entre dos registros de un
mismo animal.
Registro Subsiguiente r
Registro Previo
Espécie Característica Repetibilidade (r)
Bovinos de corte Peso ao nascer 0,20 - 0,30
Peso a desmama 0,30 – 0,50
Ganho diário até a desmama 0,15 – 0,20
Medidas corporais 0,70 – 0,90
Bovinos de leite Produção de leite 0,35 – 0,40
Produção de gordura 0,35 – 0,45
Percentagem de gordura 0,50 – 0,70
Intervalo entre partos 0,01 - 0,10
Número de serviços por concepção 0,01 – 0,05
Suínos Tamanho da leitegada ao nascimento 0,05 – 0,15
Tamanho da leitegada a desmama 0,08 – 0,10
Peso da leitegada ao nascimento 0,12 – 0,25
Peso da leitegada a desmama 0,05 – 0,20
Intervalo de partos 0,10 – 0,25
Aves Peso do ovo 0,80 – 0,95
Forma do ovo 0,90 – 0,95
Peso da casca 0,60 – 0,80
Maturidade sexual 0,60 – 0,70
Número de ovos 0,70 – 0,85
Ribeiro (2004)
CALCULO DE LA REPETIBILIDAD
Pij = μ + Ai + Mij
Pij = j registros en el animal i
Ai = Efecto del animal en Pij
Mij = Efecto al azar del medio temporal
i=1......B B = Número de animales
J=1.….ni ni = Número de registro en el animal i
Asumimos que Ai y Mij son idénticos e independientemente distribuidos y no existe
correlación entre animales y medio.
ESTIMACIÓN DE LA REPETIBILIDAD POR REGRESIÓN Y CORRELACIÓN
Estimada de la varianza del registro 1 Estimada de la varianza del registro 2
Estimada de la covarianza de los dos registros
^
Donde las expectaciones son:
El Coeficiente de regresión es igual El Coeficiente de correlación es igual
Correlación entre
las sucesivas
mediciones del
mismo carácter en
el mismo grupo de
individuos.
• CORRELACIÓN: Entre registros sucesivos. 𝑟 = 𝑟1,2
• REGRESIÓN: Entre registros sucesivos. 𝑟 = 𝑏2,1
Ejercicio:
En un rebaño de ovejas se midió el peso del vellón en dos años seguidos.
Calcular la repetibilidad por regresión y correlación.
Animal Año 1 Año 2
No. Pi1 Pi2
1 7.11 7.05
2 6.43 6.51
3 6.32 7.19
4 10.57 10.11
5 5.08 2.96
6 6.69 7.84
7 1.18 2.42
8 4.72 6.84
9 9.67 6.3
10 8.43 7.02
DESARROLLO:
10
𝑃𝑖1 = (7.11)2 + (6.43)2 +………+ (8.43)2 = 502.37
𝐼=1
10
𝑃𝑖2 = (7.05)2 + (6.51)2 +………+ (7.02)2 = 457.83
𝐼=1
10
𝑃𝑖1𝑃𝑖2 = (7.11) (7.05) + (6.43) (6.51) +………+ (8.43) (7.02) = 467.01
𝐼=1
n
2
𝜕𝑝1 =( Ʃ 𝑝12 - 𝑝12 /n)/n-1
i=1
2
𝜕𝑝1 =(502.37- 438.24)/9
2
𝜕𝑝1 = 7.12
2
𝜕𝑝2 =( Ʃ 𝑝22 - 𝑝22 /n)/n-1
2
𝜕𝑝2 =( 457.83- 412.68)/9
2
𝜕𝑝2 = 5.01
n
𝜕𝑝1𝑝2 =( Ʃ 𝑝1 𝑝2 - 𝑝1 𝑝2 /n)/n-1
i=1
𝜕𝑝1𝑝2 =( 467.02 - 425.27)/9
𝜕𝑝1𝑝2 = 4.63
𝜕𝑝1𝑝2 4.64
𝑟𝑟 = 2 =
𝜕𝑝1 7.12
Esto significa que el peso del vellón
tiene una repetibilidad de un 65%
entre dos años seguidos.
𝑟𝑟 = 0.65
𝜕𝑝1𝑝2 4.6385
𝑟𝑐 = =
2 2 7.1253 ∗ 5.0170
𝜕𝑝1 𝜕𝑝2
Esto significa que el peso del
vellón tiene una repetibilidad de
78% entre dos años seguidos.
𝑟𝑐 = 0.78
Como se puede ver la repetibilidad por correlación es mas alta y es la mas adecuada
porque toma en consideración la varianza de los dos tipos de registros.
E. ESTIMACIÓN DE REPETIBILIDAD POR COMPONENTES DE LA VARIANZA
Este procedimiento se utiliza cuando tenemos i animales que tienen ni registros, donde
j=1.....ni; y B es un número de animales que toman valores que van de i=1….B.
Las expectaciones de las sumas de cuadrados usados para estimar y son:
Los componentes de la varianza a ser estimados son reemplazados en las expectaciones, por
las estimadas de los componentes de la varianza y entonces igualados a la suma de los
cuadrados, las estimadas entonces son:
Se mantiene la definición:
Donde, Entonces
Ejercicio:
Número de gazapos al nacimiento registrados en diferentes partos en los conejos
Número de Partos
Animal 1 2 3 Pi ni
1 6 7 - 13 2
2 7 - - 7 1
3 5 7 7 19 3
4 6 5 - 11 2
5 7 8 - 15 2
6 5 - - 5 1
7 6 8 7 21 3
8 8 6 8 22 3
P..=113 n.=17
Calcular la repetibilidad por componentes de la varianza.
2
(Ʃ Ʃ𝑝𝑖𝑗 = n 𝜇2 + 𝑛 𝜕𝐴2 + 𝑛 𝜕𝐸2
2
(Ʃ Ʃ𝑝𝑖𝑗 = 62 + 72 + ⋯ . . +82 = 769.00
2
( Ʃ𝑝𝑖𝑗 /𝑛𝑖 ) = n 𝜇2 + 𝑛 𝜕𝐴2 + 𝜕𝐸2
2 132 72 222
( Ʃ𝑝𝑖𝑗 /𝑛𝑖 ) = 2 + + ⋯..+ 3 = 760.17
1
(𝑝2 … ./𝑛𝑖 ) = n 𝜇2 + 1/𝑛 Ʃ𝑛𝑖2 𝜕𝐴2 + 𝜕𝐸2
(𝑝2 … ./𝑛𝑖 ) = 1132 /17 = 751.12
2 2
𝜕𝐸2 = (Ʃ Ʃ𝑝𝑖𝑗 − Ʃ𝑝𝑖𝑗 / 𝑛𝑖 )/ (n – B)
𝜕𝐸2 = (769 – 760.17)/(17-8) = 0.98
2 2
𝜕𝐴2 = ( Ʃ𝑝𝑖𝑗 / 𝑛𝑖 − 𝑝𝑖𝑗 …./ 𝑛𝑖 − 𝐵 − 1 𝜕𝐸2 ))/ (n – Ʃ𝑛𝑖2 /𝑛)
𝜕𝐴2 = ( 760.17 − 751.12 − 7 0.98))/ (17 – 2.412) = 0.15
𝑟𝑐𝑣 = 𝜕𝐴2 / 𝜕𝐴2 + 𝜕𝐸2
𝑟𝑐𝑣 = 0.15/ (0.15+0.98) = 0.13
La estimada de la repetibilidad para el numero de gazapos al
nacimiento es de 13%.
DEBER
1. Ejercicio: Calcular la repetibilidad para el número de partos en cerdas.
Animal año 1 año 2
Regresión y correlación
# Pi1 Pi2
1 1.57 1.19
2 1.34 2.57
3 2.31 1.43
4 1.49 1.82
5 1.32 1.20
6 1.00 1.20
7 1.27 1.33
8 1.28 1.87
9 1.98 1.44
10 0.90 1.15
P1 = 14.46 P2= 15.2
2. Replicar los cálculos con datos de registros de peso al nacimiento en la
Unidad de Pdn porcina. Sacar una copia de respaldo de los registros
utilizados.
Promedio de pesos al nacimiento por partos en porcinos.
Numero de partos
#
Animal 1 2 3 4 5 6 7
1 2,3 2,5 2,2 2,5 2,5 2,0 2,5
2 2,5 2,3 2,3 3,3
3 2,3 2,7 2,0 2,8 2,5 2,2 2,0
4 2,7 1,8 1,5 1,5 2,8 3,5 3,2
5 2,5 4,6 1,5 1,8 1,5 2,5 3,4
6 4,0 3,0 2,2 2,0 2,3 2,5 4,4
7 2,2 3,1 2,0 2,0 3,5 3,3 3,5
8 4,0 3,4 2,5 3,7 3,0 4,3
HEREDABILIDAD (𝒉𝟐 )
•Heredabilidad es la parte genética del animal que puede ser heredada. Para su estimación es
necesario conocer registros de parientes en un mismo carácter.
•Heredabilidad es el resultado de la división de la varianza debido al efecto genético para la
varianza fenotípica.
2
G
Esta división en sentido amplio se considera: h 2
2
G 2E
2
GA
Esta división en sentido estricto se considera: h 2
2
GA 2 E
Cuando asumimos que la varianza genética se puede cuantificar es únicamente la varianza genética
aditiva.
ALGUNOS CONCEPTOS DE HEREDABILIDAD
ALGUNOS CONCEPTOS DE HEREDABILIDAD
ALGUNOS CONCEPTOS DE HEREDABILIDAD
Estimación de Heredabilidad
•Se recurre al grado de parecido entre
parientes, característica básica en
caracteres cuantitativos.
• Mediciones simples en la población
•El grado de parecido entre parientes permite
estimar VA y con ella la heredabilidad
CÁLCULO DE LA HEREDABILIDAD
Para calcular la heredabilidad se utiliza el siguiente modelo:
Pxi = μ + Gxi + Exi
Pyi = μ + Gyi + Eyi
Pxi y Pyi son los registros de parientes X y Y, los cuales tienen una relación aditiva así:
axiyi= axy cuando los i son los mismos.
axiyi= 0 cuando i no es igual a i COEFICIENTE (𝒉𝟐 )
RANGOS (r)
Baja 0 – 10
Media 11 – 30
Alta > 30
MEJORAMIENTO GENETICO
DE GANADO LECHERO
PRINCIPIOS BASICOS
LOS CARACTERES de PRODUCCION y PRACTICAMENTE
TODOS los CARACTERES de IMPORTANCIA son POLIGENICOS
CADA UNO DE LOS GENES INVOLUCRADOS APORTA UN
DETERMINADO EFECTO AL VALOR TOTAL DEL CARÁCTER.
AUN NO ES POSIBLE IDENTIFICAR LOS GENES QUE
INFLUENCIAN CADA CARACTER POLIGÉNICO.
HEREDABILIDAD DE LOS CARACTERES
CORRELACIONES GENETICAS ENTRE CARACTERES
HEREDABILIDAD
ES EL COMPONENTE GENETICO (aditivo)
EN EL VALOR FENOTIPICO DEL CARACTER.
DETERMINA LA PORCION EN LA CUAL EL VALOR
FENOTIPICO DE LOS PADRES ES TRANSMITIBLE A LOS
DESCENDIENTES
LA HEREDABILIDAD SE MIDE EN UNA ESCALA
DE 0.00 (or 0%) A 1.00 (or 100%)
Menos de 10% HEREDABILIDAD BAJA
10% a 30% HEREDABILIDAD MEDIANA
Más de 30% HEREDABILIDAD ALTA
HEREDABILIDAD DE ALGUNOS CARACTERES
EN GANADO LECHERO
CARACTERES de PRODUCCION
LECHE (Kg) 25 %
PRODUCCION DE GRASA (Kg) 25 %
PRODUCCION DE PROTEINA (Kg) 25 %
PORCENTAJE DE GRASA 50 %
PORCENTAJE DE PROTEINA 60 %
CARACTERES DE TIPO
ESTATURA 37 %
PROFUNDIDAD CORPORAL 32 %
INCLINACION DE GRUPA 24 %
ANGULARIDAD 23 %
PUNTAJE FINAL 30 %
SISTEMA MAMARIO
PROFUNDIDAD DE UBRE 25 %
LIGAMENTO DELANTERO 18 %
ALTURA POSTERIOR 18 %
LIGAMENTO MEDIO 15 %
UBICACION DE PEZONES 21 %
LONGITUD DE PEZONES 26 %
HEREDABILIDAD DE DIFERENTES CARACTERES
EN GANADO LECHERO
OTROS CARACTERES
RECUENTO DE CELULAS SOMATICAS 10%
VELOCIDAD DE ORDEÑO 11%
TEMPERAMENTO 12%
RITMO DE AUMENTO DE PESO 45%
PESO ADULTO 65%
PESO AL PARTO 40%
FERTILIDAD
DIAS ABIERTOS 3%
PROLIFICIDAD 5%
PARTO DISTOCICO 4%
En término de expectaciones:
Esto implica que la interacción:
Esto implica que:
Donde:
Donde:
Donde:
Sin embargo:
ESTIMADA DE LA HEREDABILIDAD MEDIANTE REGRESIÓN
Primero calculamos el coeficiente de regresión que es igual a:
Entonces la estimada de la heredabilidad mediante regresión entre registros de los parientes Y en los relativos X
es:
Reemplazando el valor de la regresión tenemos:
Simplificando nos queda:
ESTIMADA DE LA HEREDABILIDAD MEDIANTE CORRELACIÓN
Primero calculamos el coeficiente de correlación que es igual a:
Entonces la heredabilidad por correlación es igual a:
Reemplazando el valor de correlación tenemos:
Simplificando tenemos:
Ejercicio:
Calculo de la heredabilidad de los registros de peso al destete de padres e hijos en
ganado bovino de carne.
No. de Peso (Kg.) Peso (Kg.)
Pares Padres (X) Hijos (Y)
1 195 190
2 203 215
3 186 197
4 230 205
5 200 210
6 210 180
7 195 215
8 230 205
9 220 190
10 225 235
ESTIMADA DE LA HEREDABILIDAD POR COMPONENTES DE LA VARIANZA
Al igual que el método anterior los registros utilizados se ajustan a un modelo matemático:
Pij = μ + bi + Wij
Donde:
bi= Efecto común de todos los miembros del grupo genético i.
Wij= Efecto al azar asociado entre los miembros j del grupo i.
i= 1 ………B ; j=1………..ni
Se asume que los b’s y los w’s son idénticos e independientemente distribuidos.
En término de expectaciones:
Estas definiciones del modelo llevan a las siguientes expectaciones de las tres sumas de
los cuadrados usados para estimar y
Cálculo de heredabilidad por Componentes de la Varianza
Cuando las Cuadráticas son iguales a las expectaciones de los valores estimados son:
Ejercicio:
El promedio de gazapos al nacimiento de diferentes padres y diferentes madres está en el
cuadro siguiente:
Padres Progenie
i 1 2 3 4 5 6
1 6 7 5 - - -
2 5 8 4 - - -
3 7 - - - - -
4 4 6 - - - -
5 5 4 7 6 - -
6 7 6 7 8 7 -
7 8 - - - - -
La varianza de la heredabilidad:
CORRELACIONES GENETICAS
DETERMINAN EL CAMBIO A PRODUCIRSE EN UN CIERTO
CARACTER (QUE ESTA “GENETICAMENTE
CORRELACIONADO CON EL CARACTER BAJO
MEJORAMIENTO GENETICO”)
COMO CONSECUENCIA DEL MEJORAMIENTO GENETICO
DEL CARACTER BAJO SELECCION.
BRINDAN UNA ESTIMACION DE LA MEDIDA EN QUE DOS
CARACTERES “ESTAN LIGADOS GENETICAMENTE”:
CUAL ES EL “SIGNO” DE TAL RELACION Y CUAL ES LA
“FORTALEZA DEL VINCULO”.
CORRELACIONES GENETICAS
LOS VALORES DE LAS CORRELACIONES GENETICAS
VAN DE -1 a +1
Valor de la
correlaci ón significado
los caracteres “progresan” en la misma dirección, en forma
1.0 a 0.4 significativa.
los caracteres “progresan” independientemente el uno del
0.4 a -0.4 otro.
los caracteres “progresan” en dirección opuesta, en forma
-0.4 a -1 significativa.
CORRELACIONES GENETICAS y FENOTIPICAS
ENTRE CARACTERES
LECHE GRASA PROTEINA GRASA PROTEINA
Kg Kg Kg % %
LECHE (Kg) - 0.42 0.78 - 0.53 - 0.63
GRASA(Kg) 0.68 - 0.63 0.54 0.12
PROTEINA (Kg) 0.90 0.75 - - 0.14 - 0.02
GRASA (%) - 0.34 0.44 - 0.13 - 0.70
PROTEINA (%) - 0.40 0.02 0.03 0.52 -
CORRELACIONES GENETICAS ENTRE PRODUCCION DE LECHE
Y CARACTERES DE TIPO (CORPORALES)
Carácter Correlación
Puntaje Total -0.14
Apariencia General -0.16
Carácter Lechero 0.38
Capacidad Corporal -0.14
Sistema Mamario -0.15
Caracteres corporales descriptivos*
Estatura -0.07 Pies -0.06
Cabeza -0.09 Ubre delantera -0.22
Tórax (pecho) -0.11 Ubre posterior -0.07
Lomo -0.11 Soporte de ubre -0.04
Grupa -0.20 Calidad de ubre -0.02
Patas traseras -0.10 Pezones -0.06
*Los caracteres corporales descriptivos fueron medidos como porcentaje de lo
deseable (óptimo).
EJERCICIO