Probabilidades en Cirugías de Alto Riesgo
Probabilidades en Cirugías de Alto Riesgo
Ciencias Biológicas
2009
1
UNIVERSIDAD DE BUENOS AIRES
FACULTAD DE CIENCIAS EXACTAS Y NATURALES
DEPARTAMENTO DE ECOLOGÍA, GENÉTICA Y EVOLUCIÓN
ASIGNATURA: BIOMETRÍA
PROFESOR: Dr. Javier A. Calcagno
CLASES TEÓRICAS: 6 horas semanales
CLASES PRÁCTICAS: 8 horas semanales
DURACION: 16 SEMANAS
PRIMER CUATRIMESTRE DE 2009
PROGRAMA
2.- Manejo de datos. Muestra y población. Muestreo con y sin reemplazo. Idea de algunas
técnicas de muestreo. Relación entre tamaño de muestra y de población. Unidad experimental.
Población estadística, población y alcance de la experiencia. Alcance de las observaciones Error
muestral. Variables aleatorias: sus distintos tipos. Escalas. Frecuencias absoluta y relativa.
Presentación, resumen y caracterización de la información. Distribución de frecuencias: agrupadas
y sin agrupar. Gráficos: diagrama de barras, histograma común y de áreas. Frecuencia acumulada.
Polígonos de frecuencias y de frecuencias acumuladas. Gráfico de perfiles .
3.- Estadística Descriptiva. Medidas de posición: media, moda, mediana, cuartiles. Propiedades y
relaciones. Medidas de dispersión: amplitud muestral, desviación intercuartil, varianza, desviación
estándar. Propiedades. La varianza como un cuadrado medio. Coeficiente de variación muestral.
Datos aberrantes.
4.- Teoría de Probabilidades. Experimento aleatorio: sus resultados posibles. Espacio muestral.
Sucesos. Frecuencia relativa: su estabilidad (Ley de los Grandes Números). Equiprobabilidad.
Axiomas de probabilidad. Espacio de probabilidad. Probabilidad condicional. Sucesos
independientes. Prueba de diagnóstico. Concepto de variable aleatoria unidimensional y
bidimensional. Distribución en probabilidades. Función de densidad y de distribución. Esperanza y
varianza de una variable aleatoria. Covarianza.
2
para la validez de las estimaciones en cada caso. Estimación del tamaño muestral. Uso de los
intervalos de confianza para inferir cuestiones acerca de la población.
8.- Inferencia Estadística. Prueba de hipótesis: sus elementos. Error de tipo I y II. Nivel de
significación. Potencia. Prueba de hipótesis para una muestra. Estimación del tamaño de la
muestra para una potencia dada. Cálculo del valor p de significación. Pruebas de hipótesis para
dos muestras independientes y dos muestras pareadas.
10.- Análisis de la Varianza. Introducción: ejemplos de los distintos diseños. Anova de un factor
fijo. Modelo lineal. Suposiciones. Descomposición de la suma de cuadrados total y de los grados
de libertad. Comparaciones planeadas y no planeadas. Métodos de comparaciones de Bonferroni,
Scheffé, Tukey, Dunnett. Comparaciones ortogonales. Caso particular de dos muestras
independientes. Validez de las suposiciones del Anova. Transformación de datos. Anova de dos
factores fijos. Modelo lineal. Suposiciones. Interacción. Pruebas de efectos principales y de efectos
simples. Diseño completamente aleatorizado (DCA). Diseño en bloques al azar (DBA). Caso
particular de dos muestras pareadas. Prueba de Tukey de no aditividad. Idea de modelos
aleatorios. Componentes de la varianza.
11.- Regresión y Correlación. Ajuste de una curva a los datos. Diagrama de dispersión. Modelo
de regresión lineal simple. Suposiciones. Ejemplo de regresiones no lineales que pueden
linealizarse: curva logística, curvas de crecimiento. Alometría, isometría. Recta de mínimos
cuadrados. Estimadores de mínimos cuadrados de los parámetros de la recta de regresión.
Varianza de los estimadores. Evaluación de la regresión. Coeficiente de determinación R2.
Comparación de las rectas de regresión: prueba de igualdad de pendientes. Predicción. Intervalo
de predicción. Intervalo de confianza para E(Y). Banda de confianza para la recta de regresión
poblacional. Caso de más de un valor de la variable dependiente para cada valor de la
independiente. Prueba de falta de ajuste. Modelo de correlación lineal. Coeficiente de correlación
lineal (ρ) de Pearson. Prueba de significación de la correlación. Intervalo de confianza para el
coeficiente de correlación ρ. Prueba de homogeneidad de los coeficientes de correlación.
BIBLIOGRAFÍA
3
STEEL, R. G. , J. H. TORRIE and D. A. DICKEY. 1997. Principles and Procedures of
Statistical Biometrical Approach. Third edition. Mc Grw-Hill, Inc, New York.
ZAR, J. H. 1996. Biostatistical Analysis. Third Edition. Prentice-Hall, Inc., Englewood Cliffs,
N.J., New Jersey. USA.
La aprobación de la asignatura como alumno regular se puede lograr mediante dos modalidades
diferentes:
4
TRABAJO PRÁCTICO Nº 1
MANEJO DE DATOS Y ESTADÍSTICA DESCRIPTIVA
Problema 1. Definir variables aleatorias que permitan estudiar las siguientes situaciones
experimentales. Indicar cómo podrían obtenerse los valores correspondientes a cada una de ellas
y cómo podrían tabularse. Indicar la unidad experimental; cómo podría extraerse la muestra, cuál
es la población estadística y cuál es el alcance de la experiencia. En los casos en los que esto sea
pertinente, indique cuál es la población y si el alcance de la experiencia es igual a la población.
1.1.- Para un estudio nutricional se quiere comparar el efecto de tres dietas con distinto suplemento
proteico, sobre la ganancia de peso en cerdos de la raza A.
1.2.- En una zona de la Provincia de Buenos Aires se desea estimar la cantidad media de gallinas
parasitadas por granja.
1.3.- Para una campaña publicitaria se está interesado en estudiar la relación entre el hábito de
fumar (no fumador, ex fumador o fumador) y el infarto de miocardio, en individuos mayores de 50
años
1.4.- Para un estudio genético se determina la fecundidad diaria (cantidad de huevos depositados
por hembra y por día durante los primeros 14 días de vida) para cada una de las hembras de un
grupo de 50. De las mismas, 25 pertenecen a una cepa (SS) y 25 a otra (NS) de Drosophila
melanogaster.
1.5.- Se quiere estudiar la hipótesis respecto a que el tamaño de la caparazón de ejemplares de
tortuga Testudo chilensis es isométrico. Para ello se estudia la relación entre el ancho y el alto del
caparazón.
1.6.- Un entomólogo está interesado en estimar la cantidad media de especimenes deteriorados en
cajas entomológicas con cinco ejemplares cada una.
Problema 2. Se siembran semillas de una especie de araucaria en bandejas con sólo seis lugares
(una semilla por lugar). El trabajo se realiza en un vivero experimental. Al cabo de un tiempo se
toma una muestra aleatoria de 50 bandejas y se cuenta la cantidad de semillas germinadas por
bandeja con los siguientes resultados:
1 3 2 0 5 1 5 2 5 3
2 4 3 1 2 3 4 0 2 3
6 3 4 3 6 4 3 2 1 4
4 3 3 3 1 5 4 3 2 5
0 6 5 3 6 3 2 4 3 4
5
2,1 3,0 3,5 4,5 6,0 6,1 6,7 6,8 7,2 7,2
7,5 7,6 7,9 8,1 8,2 8,3 8,4 9,0 9,3 9,4
9,5 10,7 11,5 11,8 12,1 12,1 12,4 12,5 13,2 13,2
13,2 13,6 15,1
En octubre una muestra de 40 lagartos de la misma especie reveló los siguientes niveles de
testosterona en plasma:
22,0 25,1 26,2 26,4 27,0 27,2 28,6 28,7 29,0 29,7
29,8 30,2 30,3 30,5 31,5 31,6 32,5 34,3 35,9 35,9
36,1 36,9 36,9 37,2 37,2 37,4 37,5 38,3 41,8 42,7
43,2 43,7 44,5 45,0 45,2 45,4 46,1 47,5 48,3 50,5
6
Problema 4. En una investigación publicada en una revista de la Asociación Médica
Norteamericana del año 1932 se incluyó la siguiente tabla, que registra la cantidad de casos de
carcinoma de cuello de útero clasificados por edad del paciente:
Genotipo AA Aa aa
Machos 6 11 5
Hembras 7 13 8
5.2.1.- Graficar los diagramas de barras para: i) los tres genotipos de machos; ii) los tres genotipos
de hembras; iii) los tres genotipos sin discriminación de sexo.
5.2.2.- ¿Qué conclusiones pueden sacarse de la observación de los gráficos anteriores?
5.2.3.- ¿Se puede concluir a partir de esta muestra que en la población hay más hembras que
machos para cada uno de los genotipos?
5.2.4.- ¿Se puede concluir a partir de esta muestra que en la población lo más abundante es
hembras con genotipo Aa?
Control 6 1 4 5 3 2 0 5 5 -1
Tratados 5 -2 7 5 6 6 5 4 -37 7
1- Para ambos conjuntos de datos definir y clasificar la variable aleatoria, identificar la unidad
experimental, muestra y población. ¿Se trata de un estudio experimental u observacional?
2- Explique por qué la diferencia entre las medias de ambos grupos sugiere una conclusión acerca
del efecto del régimen mientras que la diferencia entre las medianas sugiere otra.
7
Problema 8. En una empresa hay 600 empleados que cobran $2200; 500 que cobran $2600; 100
que perciben $3000 y los 5 gerentes que perciben $100.000 cada uno. Calcular la media, la
mediana y la moda. Discutir qué estadístico estima mejor cuánto cobran en general los empleados
de la empresa.
Problema 9. Un docente de Biometría tiene que corregir 20 exámenes. Como el primer ejercicio, a
pesar de ser sencillo, demanda demasiadas cuentas, decide no hacerlo y estima el resultado
verdadero a partir de los resultados de los 20 alumnos. ¿Qué estadístico de tendencia central
debería utilizar?
Problema 10. Discutir la frase "La Estadística enseña que si Pedro se come un pollo y Juan
ninguno, esto equivale a que se coman medio pollo cada uno". (Sugerencia: calcular la desviación
estándar cuando uno come un pollo y el otro ninguno y comparar con la situación en la cual ambos
comen medio pollo).
Problema 11. En una localidad del GBA, que carece de agua potable, se determinó la cantidad de
bacterias coliformes en muestras de 100 ml de agua extraída de pozos para uso doméstico. Los
resultados fueron:
# de bacterias 0 1 2 3 4 5 6 7 8 9
[Link] pozos 12 38 28 16 13 11 9 7 5 1
11.1.- Defina la variable, clasifíquela, determine cuál es la unidad experimental y si se trata de una
muestra o de una población, justificando su respuesta. Complete la tabla de frecuencias y grafique.
11.2.- Se considera potable aquella agua que posea a lo sumo 3 bacterias coliformes/100 ml. ¿Qué
porcentaje de pozos en esta localidad no estarán aptos para el consumo humano?
11.3.- ¿Cuál es el promedio de coliformes en los pozos con agua potable? ¿Y en los no potables?
¿Cuál es el promedio general?
11.4.- ¿En que tipo de pozo (potable/no potable) la cantidad de bacterias/100 ml es más
homogénea?
11.5.- ¿Cuál es la cantidad de bacterias/100 ml más frecuente?
11.6.- Determine el tipo de asimetría de la distribución.
Problema 12. Como parte de un estudio para comparar la variabilidad del peso de semillas de
cierta especie vegetal en un hábitat restringido con el de otra especie caracterizada por sobrevivir
en un amplio rango de ambientes, se obtuvieron los siguientes datos: ver enunciado
8
Problema 14: Para las siguientes distribuciones de frecuencias:
1- Sin efectuar cálculos, ordénelas en orden creciente según su media, mediana, modo y desvío
estándar. Clasifíquelas según su asimetría.
2- Repita el ejercicio anterior, pero calculando los estadísticos.
7
7 7
6
6 6
5
5 5
4 4
4
f
f
f
3 3 3
2 2 2
1
1 1
0
0 0
1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
x
x x
7 7
6 7
6
6
5 5
5
4 4
4
f
f
3 3 3
2 2 2
1 1 1
0
0
0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9
x x
x
9
TRABAJO PRÁCTICO Nº 2
PROBABILIDADES
Problema 1. Describir el conjunto de los resultados posibles (espacio muestral) de los siguientes
experimentos aleatorios, asignando probabilidades a cada uno de sus elementos (espacio de
probabilidades).
1.1.- De un estanque donde sólo habitan truchas arco iris se extrae un pez al azar y se determina
la especie a la que pertenece.
1.2.- Una jaula del Zoológico contiene tres tordos, tres palomas y tres jilgueros. Se extrae un pájaro
al azar de esa jaula y se determina la especie a la que pertenece.
1.3.- De la jaula anterior se escapa un tordo y se sustituye por un jilguero, a continuación se extrae
un pájaro al azar de esa jaula y se observa a qué especie corresponde.
1.4.- En una bolsa hay cuatro bolitas idénticas, numeradas de 1 a 4. Sea el juego que consiste en
extraer una bolita al azar, anotar el número de la misma y devolverla a la bolsa; luego sacar una
nueva bolita y anotar su número a continuación del primero, obteniéndose así un número de dos
dígitos.
1.5.- El mismo juego que en (1.4.), pero la primera bolita no se devuelve a la bolsa.
Problema 3. En una jaula del Bioterio de la Ciudad Universitaria hay 25 ratas de dos especies: 10
de Rattus rattus y 15 de Rattus novergicus. Sea el experimento que consiste en extraer al azar dos
ratas de dicha jaula. Suponiendo que los experimentos se realizan: (a) con reposición; (b) sin
reposición pero en orden; (c) simultáneamente (sin reposición, sin importar el orden).
3.1.- Describir el espacio muestral (resultados posibles) ¿Los resultados posibles son
equiprobables? Asignar probabilidades a cada uno de los elementos del espacio muestral.
3.2.- Calcular, para cada tipo de extracción, la probabilidad de que las dos ratas extraídas sean de
la misma especie.
3.3.- Calcular, para cada tipo de extracción (cuando sea posible), la probabilidad de que la primera
rata extraída sea R. rattus.
Problema 5. Los cuatro grupos sanguíneos se reparten en una población de la siguiente manera:
0 = 45%, A = 43%, B = 8%, AB = 4%.
Suponga que se eligen dos personas al azar. ¿Cuál es la probabilidad de que:
1- las dos pertenezcan al grupo 0?
2- una sea del grupo A y la otra del B?
3- las dos pertenezcan al mismo grupo sanguíneo?
4- Se necesitan dadores del grupo AB. ¿Cuál es la probabilidad de que ninguna de estas dos
personas pueda ser donante? (suponer que no existe compatibilidad entre grupos)
10
Problema 6. En un laboratorio de comportamiento hay dos peceras conteniendo 5 y
10 ejemplares respectivamente de carpa dorada (Carassius auratus). Aunque el
investigador no lo sabe, un ejemplar de la primera pecera y tres de la segunda están
parasitados por el copépodo Ergasilus sp. El acuarista elige un ejemplar cualquiera
para una experiencia.
6.1.- ¿Cuál es la probabilidad de que haya elegido uno de los parasitados?
6.2.- Si el ejemplar elegido fue uno de los parasitados por Ergasilus sp, ¿cuál es la
probabilidad de que haya sido sacado de la primera pecera?
Problema 8. En una laguna, el 92% de las algas pertenece al fitoplancton (algas que flotan
libremente), mientras que el 8% restante corresponde al perifiton (algas que crecen sobre plantas
acuáticas). Dentro de las algas fitoplanctónicas, el 56% son diatomeas. En el perifiton, las
diatomeas componen el 40%.
8.1.- Habiéndose tomado una muestra al azar, asignar una probabilidad a cada uno de los
resultados posibles.
8.2.- Calcular la probabilidad de que un alga elegida al azar sea una diatomea.
8.3.- Calcular la probabilidad de que un alga elegida al azar sea una diatomea o pertenezca al
perifiton.
8.4.- De las diatomeas, ¿qué porcentaje corresponde a perifiton?
8.5.- ¿Qué proporción de las algas son diatomeas fitoplanctónicas?
Problema 9. Una determinada especie de gorgojo contrae una enfermedad virósica sólo al salir del
huevo. Esta enfermedad mata al 100% de los animales en la última muda, es decir cuando van a
pasar al estado adulto. Se sabe que, en un granero, el 50% de los gorgojos son adultos y el 30%
de las larvas están enfermas.
9.1.- Construir la tabla de contingencia.
9.2.- Calcular el porcentaje de ejemplares enfermos.
9.3.- ¿Son independientes las dos variables relevadas? Justificar.
Problema 10. Un señor muy precavido que deseaba volar en avión a New York preguntó a su
amigo estadístico: "¿Cuál es la chance de que haya una bomba en el avión?". Al contestársele que
esa probabilidad era de 1/ 1000 quedó perplejo y sumamente ansioso. Entonces volvió a preguntar
a su amigo: "¿Cuál es la chance de que haya dos bombas en el avión?". El estadístico le contestó
11
que esa probabilidad era de 1/ 1.000.000. "Ah, - dijo el señor - sabiendo esto llevaré una bomba
conmigo". ¿Cuál es la falacia del razonamiento del señor?
Problema 11. Supongamos que el color de ojos está determinado por un único gen. Sea B el alelo
dominante (ojos marrones) y b el recesivo (ojos azules). Un individuo con genotipo BB tendrá ojos
marrones y un individuo con genotipo Bb también tendrá ojos marrones. Sólo tendrán ojos azules
los individuos con genotipo bb. En un matrimonio entre heterocigotas,
11.1.- Indicar las probabilidades en la descendencia (F1) para cada uno de los genotipos posibles.
11.2.- Indicar las probabilidades en la descendencia (F1) para cada uno de los fenotipos posibles.
11.3.- Dado que el primer hijo tiene ojos marrones, calcular la probabilidad de que su genotipo sea
BB.
Problema 12. Muchas veces se realizan estudios para investigar la asociación entre un factor,
llamado de riesgo, y el desarrollo de una condición específica, por ejemplo, una enfermedad. Para
ello se seleccionan dos muestras, una de sujetos que han estado expuestos al factor de riesgo (R)
y otra de sujetos que no lo estuvieron ( R ). Los sujetos de cada una de las muestras se clasifican
según hayan contraído una enfermedad (E) o no ( E ). Entonces el riesgo relativo se estima como:
RR = P (E / R) / P (E / R )
y es una medida de impacto del factor de riesgo. Si el valor obtenido es 1 sugiere que el pretendido
factor de riesgo no es tal. ¿Cómo se interpretarían valores superiores a 1? ¿e inferiores?
Encuesta de Factores de Riesgo: En la Argentina, al igual que en los países más desarrollados,
las enfermedades no transmisibles (enfermedades cardiovasculares, cáncer y lesiones) (ENT) ya
han conquistado el primer lugar como causantes de dolencias y de muerte. Sin embargo, las ENT
son prevenibles y se cuenta con evidencia consistente sobre la efectividad de intervenciones de
promoción, prevención y tratamiento, que justifican llevar a cabo acciones de política pública. Para
poder realizar estas intervenciones se necesita disponer de información relevante relacionada con
las principales causas de las ENT. Los principales determinantes de las ENT son los llamados
Factores de Riesgo, como el tabaco, el alcohol, la inactividad física, la presión arterial elevada, el
colesterol elevado, la diabetes y la alimentación no saludable. Es por ello que el Ministerio de
Salud de la Nación realizó en 2006 la primera Encuesta de Factores de Riesgo (disponible en
[Link] que presenta la situación de los principales
determinantes del riesgo de enfermedades no transmisibles.
La encuesta fue domiciliaria. Los resultados que se presentan corresponden la ciudad de Buenos
Aires, en donde se encuestaron un total de 2000 habitantes de 18 años y más. Para ello se
efectuó un muestreo probabilístico de viviendas y de cada una se seleccionó al azar un individuo,
que completó el cuestionario. Algunos resultados fueron:
Tabla 1: Consumo de tabaco según edad
Consumo de tabaco
Total
Edad Nunca Total
Fumador Ex-fumador encuestados
fumador
18 a 25 37,3% 5,9% 56,8% 100% 14,9%
25 a 35 34,3% 18,5% 47,2% 100% 20,9%
35 a 50 34,0% 23,9% 42,1% 100% 23,4%
50 a 65 23,6% 36,6% 39,8% 100% 22,0%
65 a 85 8,1% 30,7% 61,2% 100% 18,8%
100,0%
12
1- Identifique para los datos proporcionados de la Encuesta Nacional de Factores de Riesgo los
siguientes ítems: población, muestra, individuo, variables estudiadas y su clasificación.
2- Interprete el valor 34.3% de la Tabla 1.
3- Construya la tabla de doble entrada (en porcentajes) para consumo de tabaco x edad.
Identifique en dicha tabla dos sucesos compatibles y dos incompatibles, justificando su
elección.
4- Determine la prevalencia del hábito de fumar en la ciudad de Buenos Aires.
5- ¿Es independiente el consumo de tabaco de la edad del individuo? Justifique exponiendo datos
de la encuesta.
6- Reagrupe la información para construir una tabla de doble entrada con las categorías fumador-
no fumador y 18 a 25 años-mayor de 25 años. ¿Constituye el primer rango de edad un factor
de riesgo para el tabaquismo? Justifique.
7- ¿Qué porcentaje de los individuos no fumadores están expuestos a humo ambiental de tabaco
en el hogar o en el lugar de estudio? ¿Y qué porcentaje no está expuesto en el trabajo?
Indique qué grafico utilizaría para presentar los resultados de la Tabla 2.
8- Comente los resultados de la encuesta en la ciudad de Buenos Aires. ¿Sobre qué grupos
enfocaría una eventual campaña contra el tabaquismo?
13
TRABAJO PRÁCTICO N°3
DISTRIBUCIONES DISCRETAS
Problema 2. Mediante la irradiación del óvulo o del espermatozoide pueden causarse mutaciones
que conducen a abortos, defectos de nacimiento u otras deficiencias genéticas. La probabilidad de
que tales mutaciones se produzcan es de 1 en 10. Si se irradian 15 óvulos,
1- ¿cuántos esperaría que presenten mutaciones?
2- ¿Cuál es la probabilidad de que solamente 2 presenten mutaciones?
3- ¿Cuál es la probabilidad de que a lo sumo dos presenten mutaciones?
4- Definir la variable en estudio y construir su distribución de probabilidades. Graficar. Calcular
su esperanza y varianza y determinar el tipo de asimetría.
Problema 3. Se planea construir una planta nuclear y se quiere conocer la opinión de la población
al respecto. Se piensa que el 30% de los habitantes de la localidad estarán a favor del proyecto. Se
selecciona una muestra aleatoria de 20 individuos y se realiza un sondeo. Si la suposición es
cierta,
3.1.- ¿cuántos deberían expresar una opinión favorable?
3.2.- Calcular la probabilidad de que a lo sumo 4 sean de opinión favorable.
3.3.- Calcular la probabilidad de que 18 o más estén en contra.
14
5.1.- Cuál es la probabilidad de que en el próximo mes (8 hs diarias, 5 días hábiles/semana, 4
semanas) el aparato no requiera reparaciones?
5.2.- Si en los próximos 3 meses de trabajo el aparato debe ser reparado en más de 5
oportunidades, será reemplazado por otro modelo. ¿Cuál es la probabilidad de que esto ocurra?
Problema 6. Para un trabajo de epidemiología del dengue se necesitan larvas del mosquito Aedes
aegipty, que se sabe se disponen al azar en cierto cuerpo de agua, a razón de 1.9 larvas por cada
2 ml de agua, en promedio.
6.1.- Si se extrae una muestra de 2 ml de agua, ¿cuál es la probabilidad de que contenga
exactamente 2 larvas?
6.2.- En una muestra de 4 ml, ¿cuál es la probabilidad de encontrar exactamente 4 larvas?
6.3.- En una muestra de 3 ml, ¿cuál es la probabilidad de encontrar a lo sumo 4 larvas?
6.4.- Defina la variable en estudio y determine su esperanza y varianza.
Problema 10. Un señor, vuelve una noche a su casa en estado de ebriedad y pretende abrir la
puerta probando en cualquier orden, las 10 llaves de su llavero.
10.1.- ¿Qué probabilidad tiene de abrir en el séptimo intento?
10.2.- ¿Qué probabilidad tiene de quedarse afuera? Generalizar y especular.
10.3.- Calcular la probabilidad de (10.1) para un día en que el mencionado señor está sobrio pero a
oscuras.
Problema 11. En los siguientes ejemplos se definen variables aleatorias. Indicar para cada una de
ellas cuál podría ser su distribución en probabilidades, su dominio, cuáles son los parámetros
correspondientes (en términos del problema) y cuál es la unidad experimental o de muestreo
15
(según corresponda), el alcance y la población estadística. Especificar, cuando sea necesario,
condiciones para la validez de la respuesta.
11.1.- Se lleva a cabo un experimento para probar la eficacia de una dosis letal de morfina en
ratones. Se supone que esta dosis tiene una efectividad del 80 %. La experiencia consiste en
inyectar la dosis a un lote de 10 ratones. Sea X: cantidad de ratones muertos al cabo de dos días.
11.2.- Una pareja se ha propuesto tener una hija. Decide continuar teniendo hijos hasta que nazca
una mujer, momento en el que ya no tendrán más descendencia. X es la cantidad de hijos nacidos
antes del nacimiento de la primera hija.
11.3.- En el estudio de los hábitos migratorios del ganso canadiense se ha anillado
aproximadamente el 5% de la población total de aves. En un día determinado se capturan 8
gansos. X es la cantidad de gansos anillados.
11.4.- Suponer que en 11.3 el tamaño de la población de gansos canadienses es de 120 y resolver
en esta situación.
11.5.- Se quiere estimar la cantidad de gorgojos machos en 5 gramos de muestra de harina
leudante.
11.6.- En una secuencia de ARN, UGG codifica el triptofano y UGA codifica una señal de parada.
En un determinado segmento de ARN aparece cinco veces la palabra UGA. Supóngase que los
nucleótidos U y G no sufrieron mutación, pero que el nucleótido A (adenina) mutara a G (guanina)
el 1 % de las veces. X es la cantidad de mutaciones de la secuencia en que la señal de parada
(UGA) se muta a triptofano (UGG).
11.7.- Se estima que sólo uno de cada 50 loros capturados en la cuenca del Amazonas, para su
utilización como animales domésticos sobrevive al cambio. X es la cantidad de loros que
sobreviven en una captura de 200 animales.
11.8.- Hay un torneo infantil de pesca de mojarrita en la laguna Truchimus. Cada niño debe pescar
6 ejemplares. Sea X: cantidad de mojarritas con peso entre 10,5 y 15,5 gramos.
11.9.- Un médico de un hospital del conurbano está interesado en estimar la cantidad media diaria
de pacientes que ingresan por intoxicación con alcohol (etílico) a la Guardia. Y: cantidad de
intoxicados / día.
16
TRABAJO PRÁCTICO Nº 4
DISTRIBUCIONES CONTINUAS
Problema 1. Un criador de ranas toro afirma que al llegar al año de vida, el peso promedio de
éstas es de 160 grs. Si el peso de las ranas toro al año de vida se distribuye normalmente con un
desvío de 11 grs,
1.1.- ¿Qué porcentaje de ranas de un año pesa menos de 150 gramos?
1.2- ¿Qué porcentaje de ranas pesa más de 200 gramos?
1.3.- ¿Qué porcentaje de ranas pesa exactamente 180 gramos al año?
1.4.- ¿Del 10% de las ranas toro de un año de vida con mayor peso, cuál es el peso mínimo?
1.5- Calcule el percentil 25 e interprete el resultado.
1.6.- En un lote de 200 ranas toro de un año, ¿cuántas esperaría que pesen entre 150 y 170 grs?
1.7- Calcular la probabilidad de que en un lote de 10 ranas solo una pese menos de 150 grs.
Indicar con que variable aleatoria se está trabajando y cuál es su distribución de probabilidades.
Problema 2. Un tambero está al borde de la quiebra, y todas sus esperanzas están puestas en la
producción del próximo mes. Los alumnos de Biometría quieren ayudarlo, y estudian la distribución
de la producción mensual de las vacas del tambo utilizando datos anteriores del propio tambero.
Llegan a la conclusión que el tambo de este señor produce en promedio 3000 litros de leche por
mes, con una desviación estándar de 300 litros.
2.1.- El tambero se salvaría de la quiebra si su tambo produjera más de 3250 litros de leche en el
próximo mes. ¿Cuál es la probabilidad de que esto ocurra?
2.2.- El tambero está tan desesperado que se suicidará si su tambo produjera menos de 2400 litros
de leche en el próximo mes. ¿Cuál es la probabilidad de que quiebre sin que tengamos que
lamentar su muerte?
2.3.- ¿En cuántos de 10 meses elegidos al azar, es de esperar que el tambero esté en la situación
de 2.1? Indicar con que variable aleatoria se está trabajando y cuál es su distribución en
probabilidades.
Problema 3. Los errores aleatorios que se cometen en las pesadas de una balanza siguen una
distribución normal con media 0 dg y desvío estándar 1.5 dg.
3.1.- Calcular la pb de que el error cometido en una pesada sea a lo sumo de 1.5 dg.
3.2.- Calcular la pb de que el error subestime como máximo en 1 dg al verdadero valor.
3.3.- Calcular la pb de que el error cometido sea de más de 2 dg (en ambos sentidos).
3.4.- Calcular el error máximo (en módulo) en una pesada con una probabilidad de 0.95.
Problema 4. Para un estudio de comportamiento se necesita comprar cobayos que no pesen más
de 300 g. Un nuevo criadero desea participar en el mercado; sabe que el peso medio de los
animales que ellos crían es de 280 gramos con una desviación estándar de 16 gramos.
2- ¿Qué proporción de sus ejemplares no llenarán las especificaciones?
3- El veterinario a cargo del criadero sabe que mediante una dieta adecuada es posible
reducir la varianza manteniendo una media de 280 g. Además, desea que sólo el 2 % de
los cobayos sea rechazado. ¿Qué valor debe tomar la desviación estándar?
Problema 5. Se supone que la glucemia basal en individuos sanos sigue una distribución normal
con una media de 80 mg% y un desvío estándar de 10 mg%, mientras que en los diabéticos
también sigue una distribución normal siendo su media de 160 mg% y su desvío estándar de 31
mg%.
1- Si se conviene en clasificar como sanos al 2% de los diabéticos: ¿Por debajo de qué valor
se considera sano a un individuo? ¿Cuántos sanos serán clasificados como diabéticos?
2- Se sabe que en la población en general el 10% de los individuos es diabético. ¿Cuál es la
probabilidad de que un individuo elegido al azar y diagnosticado como diabético, realmente
lo sea?
17
Problema 6. Para un determinado estudio etológico se necesitan cangrejos que posean pinzas de
más de 5 cm de longitud. Por estudios realizados con anterioridad, se sabe que el 35 % de la
población posee esa característica. Si se toma una muestra aleatoria de 50 cangrejos en el
cangrejal de Samborombón, cuál será la probabilidad de obtener:
6.1.- exactamente 10 ejemplares como los deseados
6.2.- al menos 18 ejemplares como los deseados.
Problema 7. Al someterse a un tratamiento con antibióticos cajas de Petri en las que se han
sembrado bacterias, resulta que la cantidad de colonias resistentes se distribuye al azar con una
frecuencia promedio de 15 por caja.
7.1.- Calcular la probabilidad de que la cantidad de colonias resistentes en una caja tratada elegida
al azar se encuentre entre 10 y 16 inclusive.
7.2.- Para una cierta experiencia con antibióticos se necesitan cajas con por lo menos 13 colonias
resistentes. ¿Cuántas cajas deberán prepararse para esperar 20 cajas útiles?
18
TRABAJO PRÁCTICO Nº 5
DISTRIBUCIÓN MUESTRAL. ESTIMACIÓN
Problema 1. Sea una población P formada por fichas marcadas con los números 2, 4, 6 y 8 en
proporciones iguales.
1.1.- Calcular la media µ, la varianza σ2, el extremo inferior x min y la amplitud w para la población.
1.2.- Construir una tabla con todas las muestras que puedan formarse extrayendo y reponiendo
sucesivamente y en cualquier orden dos fichas de la población.
1.3.- Sea la variable aleatoria T2 = f(muestra de tamaño 2). Indicar la unidad experimental, la
muestra y el alcance de las observaciones
1.4.- Para cada una de las muestras de tamaño dos, calcular la media muestral x-2, el extremo
inferior xmim, la amplitud muestral w y la varianza s2.
1.5.- Hallar la distribución en el muestreo del x-2 y representarla mediante un diagrama de barras.
Calcular el valor medio E(x-2) y la varianza Var(x-2) de esta distribución .
1.6.- Trabajar como en (1.3) con los estadísticos xmin, w y s2. ¿Hay diferencias entre sus
distribuciones en el muestreo y la de xmedia?
1.7.- Comparar el valor medio y la varianza obtenidos en (1.3) con el valor medio µ = 5 y la
varianza σ2 = 5 de la población (que fueron obtenidos en 1.1.).
Problema 2. Teorema Central del límite. Simulación. Suponga que de cierto fósil existen
solamente 100 ejemplares en todo el mundo. Interesa conocer la edad promedio de los mismos y
esto es posible mediante datación por C14. Supongamos que los verdaderos valores de antigüedad
de los 100 fósiles (que Ud. desconoce) son los siguientes (en miles de años):
Fósil Edad Fósil Edad Fósil Edad Fósil Edad Fósil Edad Fósil Edad Fósil Edad
1 103.7 16 99.8 31 91.2 46 80.4 61 109.6 76 74.5 91 70.6
2 77.7 17 95.2 32 89.8 47 88.5 62 87.9 77 98.4 92 104.0
3 88.8 18 98.7 33 104.9 48 93.7 63 91.7 78 50.0 93 116.3
4 86.7 19 91.3 34 98.7 49 95.8 64 78.4 79 85.6 94 88.6
5 71.8 20 108.4 35 95.8 50 88.8 65 95.2 80 88.5 95 83.3
6 87.7 21 94.2 36 108.0 51 113.7 66 89.5 81 98.8 96 88.6
7 65.8 22 89.7 37 93.6 52 72.2 67 82.9 82 52.7 97 80.0
8 88.1 23 99.6 38 89.2 53 107.4 68 102.7 83 91.7 98 71.0
9 109.3 24 84.6 39 62.1 54 102.6 69 114.2 84 85.3 99 95.7
10 68.7 25 101.5 40 88.2 55 99.7 70 72.1 85 76.7 100 108.3
11 87.0 26 78.4 41 76.0 56 53.9 71 104.4 86 108.6
12 81.0 27 96.6 42 95.4 57 79.3 72 95.6 87 87.7
13 103.0 28 105.3 43 107.9 58 113.8 73 87.9 88 88.2
14 103.5 29 98.3 44 107.7 59 108.6 74 93.0 89 71.7
15 101.0 30 79.9 45 82.1 60 103.7 75 88.5 90 65.7
El promedio de estos datos es 92,62 con un desvío estándar de 13,935 miles de años.
2.1.- Supongamos que Ud dispone de recursos para datar solamente 5 fósiles. Extraiga una
muestra al azar de 5 de ellos (puede utilizar la tecla #RAN de la calculadora) y calcule el promedio
y el desvío estándar para la antigüedad.
El promedio obtenido en base a los 100 datos es un .........................., habitualmente es
desconocido y toma ................ valor/es, por lo tanto se comporta como una...................................;
en este caso vale ......................
El promedio obtenido en base a los 10 datos es un ........................, habitualmente es con la única
información con que se cuenta y toma ................. valores, por lo tanto se comporta como una
........................................................; en este caso vale ....................... La diferencia entre el
promedio poblacional y el promedio muestral se conoce como error muestral. En este caso vale:
......................
19
2.2.- Repita el procedimiento anterior pero extrayendo una muestra de 15 fósiles (no
descarte los datos anteriores, solo agregue 10 datos más).
2.3.- Si el promedio muestral es una variable aleatoria, ¿podemos deducir qué distribución
de probabilidades tendrá y cuál será su promedio y su variabilidad? Para ello analice la
información obtenida por todo el curso y complete los siguientes gráficos:
Distribución de x
35
30
25
Frecuencia
20
15
10
0
50
60
70
80
90
10
11
12
0
Distribución de x , n= 5
35
30
25
Frecuencia
20
15
10
0
50
60
70
80
90
10
11
12
0
Distribución de x , n= 15
35
30
25
Frecuencia
20
15
10
0
50
60
70
80
90
10
11
12
0
20
NOTA: La extracción de la muestra debería ser con reposición para mantener la aleatoriedad de la
misma. Sin embargo, en general las muestras se extraen sin reposición. Esto es porque cuando el
tamaño muestral es inferior al 5% del tamaño de la población, el efecto por la falta de reposición es
mínimo y puede obviarse. Es decir que en poblaciones grandes con muestras pequeñas no sería
necesario reponer los elementos muestreados. De hecho no se reponen las unidades
experimentales en trabajos biológicos, por ejemplo de campo.
Problema 3. El diámetro medido a la altura del pecho de una población fueguina de lengas sigue
una distribución normal con media de 1 m y desviación estándar de 0,40 m. Un rodal (conjunto de
árboles) se considera maderable (apto para la fabricación de listones) si el promedio de los
diámetros de los ejemplares es superior a 0,95 m.
3.1.- Calcular la probabilidad de que un rodal de 100 lengas elegido al azar sea maderable.
3.2.- ¿Qué tamaño mínimo (número de lengas) deberá tener un rodal para ser maderable, con una
probabilidad del 85 %?
Problema 4. Después de su fabricación y envasado, las latas de tomate de una conocida marca
tienen una duración que se distribuye en forma aproximadamente normal con media 180 días y
desviación estándar 40 días. Un grupo de investigación tiene que salir de campaña y se preguntan
cuántas latas tendrán que llevar para que, con una probabilidad del 95 %, la duración promedio no
sea inferior a los 170 días. ¿Podemos ayudarlos a decidir?
Problema 5. El contenido de riboflavina (vitamina B12) en la yerba mate, sigue una distribución
normal con media de 4.4 mg/100g de yerba mate y desvío estándar de 1.31 mg/100g. Calcular:
5.1.- la probabilidad de que una muestra al azar de 16 mediciones contenga en promedio entre 3.8
y 4.2 mg de riboflavina /100g de yerba mate.
5.2.- la probabilidad de que una muestra de 20 mediciones contenga en promedio más de 4.7 mg
de riboflavina /100g de yerba mate.
5.3.- el contenido promedio de riboflavina mínimo del 10% de las muestras más nutritivas (n=20).
Problema 6. Cierta marca de jugos comercializa jugo de ananá con una acidez (medida como g de
ácido cítrico/100 ml de jugo) de 0.41 g /100 ml, con un desvío estándar de 0.21 g/100 ml, pero se
desconoce su ley de distribución. Un control rutinario sobre el proceso productivo arroja, sobre un
total de 30 determinaciones realizadas, un promedio de 0,5 g de ácido cítrico/100 ml de jugo.
Calcule la probabilidad de obtener como mínimo dicho valor. ¿Aconsejaría detener el proceso
productivo?
21
PRACTICO Nº 6
INTERVALOS DE CONFIANZA
Problema 1. Para realizar un estudio de explotación del erizo de mar se determinó el volumen
gonadal de 25 ejemplares elegidos al azar y obtuvo un volumen promedio de 160 ml. Supongamos
que la variable volumen gonadal se distribuye en forma aproximadamente normal con desviación
estándar 40 ml.
1.1.- Estimar el volumen gonadal medio de la población con una confianza del 95 %.
1.2.- ¿Cuántos ejemplares de erizo de mar deberá muestrear el investigador para estimar el
volumen gonadal medio ± 14 ml con una probabilidad del 95 %?
1.3.- Resolver los ítems anteriores suponiendo que la varianza poblacional no es conocida y que
de la muestra de 25 ejemplares se obtiene un desvío estándar de 41.38 ml.
Propionatos Cantidad de
(mg/100g) lotes
0.10-0.15 2
0.15-0.20 5
0.20-0.25 10
0.25-0.30 16
0.30-0.35 23
0.35-0.40 11
0.40-.0.45 3
1- Estime puntualmente el promedio y el desvío estándar del contenido de propionatos de este pan
lactal.
2- Estime el promedio del contenido de propionatos de este pan lactal con una confianza del 90%.
3- Idem anterior, pero con una confianza del 99%. Compare con el intervalo anterior y extraiga
conclusiones.
4- ¿Cuántos lotes más deberán muestrearse si se desea disminuir el error muestral de la
estimación anterior en un 14%?
5- Indique los supuestos necesarios para la validez de la estimación.
Problema 4. Utilizando algún paquete estadístico o una planilla de cálculo junto con las fórmulas
del error estándar para algunos estadísticos que se encuentran en la guía de tablas:
4.1- Calcular los intervalos de confianza para la media y la varianza para los datos de niveles
testosterona en plasma de los lagartos muestreados en mayo (problema 3 de la práctica 1).
22
La siguiente es la Media 9,02
salida generada por Error típico 0,57
Excel, para los Mediana 8,40
niveles de Moda 13,20
testosterona de
Desviación estándar 3,30
Tupinambis sp en el
mes de mayo. Varianza de la muestra 10,86
Para ello en Análisis Curtosis -0,59
de datos > Estadística Coeficiente de asimetría -0,17
Descriptiva > Nivel de Rango 13
confianza para la Mínimo 2,1
media (sóo calcula el Máximo 15,1
error muestral) Cuenta 33
Nivel de confianza (95,0%) 1,169
La siguiente es la Intervalos de confianza
salida generada por Bilateral
Infostat. Para ello en Estimación paramétrica
Estadísticas >
Inferencia basada en Variable Parámetro Estimación E.E. n LI(95%) LS(95%)
una muestra > testosterona Media 9,02 0,57 33 7,85 10,19
Intervalos de
confianza
Nota: Si una variable sigue una distribución normal los coeficientes de asimetría (γ1) y curtosis (γ2)
estimados por g1 y g2 respectivamente deben ser nulos. Si los intervalos incluyen el valor cero no
se rechaza la hipótesis de que la distribución de la variable es simétrica. Y la curva es una
campana. Este resultado se podría utilizar para suponer que la distribución de la variable no se
aparta de la normalidad. En base a los datos del mes de mayo se obtiene:
Estadístico Límite inferior Límite superior
Coef de asimetría (g1) -0.9759 0.6262
Coef. de Curtosis (g2) -2.1588 0.9716
4.3.- Repetir para los datos de los lagartos del mes de octubre.
Problema 5. Para estudiar la proporción de plantas de Dentaria sp, se siembran en un vivero 300
semillas de Dentaria sp; todas las plantas emergen y al cabo de un tiempo se observa que 69
plantas están florecidas y las restantes no lo están.
5.1.- Estimar mediante un intervalo de confianza del 95% la proporción de Dentaria sp. que
florecen.
5.2.- ¿Qué supuestos deben cumplirse para la validez de la estimación anterior?
5.3.- Calcular la cantidad mínima de plantas de Dentaria que se debería sembrar para estimar la
proporción de plantas con flor en ± 0,04 con una probabilidad del 95%.
23
toxoplasmosis con un 95% de confianza.
6.2.- Cuántos individuos deberán analizarse si se quiere disminuir el error de la estimación anterior
en un 50%?
Problema 9. Supongamos que en otro vivero se realiza la misma experiencia que la propuesta en
el problema 5 pero se siembran 1000 plantas, de las cuales florecen sólo 200. Estimar la diferencia
entre las proporciones de Dentaria sp. florecida en ambas áreas con una confianza del 95%.
Indicar las suposiciones para la validez de la estimación realizada.
Problema 10. Holopterus chilensis es un coleóptero barrenador que infesta a Nothofagus obliqua
(roble pellín). Se extrajo una muestra aleatoria de 30 ejemplares en el lago Lacar, con la que se
estimó la longitud corporal promedio, obteniéndose IC95 : 40-45 mm.
Indique si las siguientes afirmaciones son verdaderas o falsas, justificando su respuesta:
1. El 95% de los ejemplares mide entre 40 y 45 mm.
2. La longitud corporal promedio de los ejemplares del lago Lacar se encuentra entre 40 y 45 mm.
3. El promedio de la especie se encuentra entre 40 y 45 mm.
4. El 95% de las muestras de 30 ejemplares tienen un promedio entre 40 y 45 mm.
5. Si se aumenta la confianza el intervalo de confianza se achica (es más preciso)
6. Si se quiere achicar el intervalo de confianza se debería aumentar el tamaño de la muestra
24
TRABAJO PRÁCTICO Nº 7
PRUEBA DE HIPÓTESIS
Problema 1. Las orugas de cierta especie de mariposa acumulan glucósidos que las hacen
repugnantes a los pájaros, por lo cual éstos tienden a evitarlas después de un primer encuentro.
En la zona de Punta Indio, provincia de Bs. As., se recolectaron 64 de tales orugas y se les
determinó la concentración de glucósidos en relación a sus pesos, resultando un valor medio de
0,18%. Estudios anteriores aseguran que la población en estudio sigue una distribución
aproximadamente normal con media de 0,19% y varianza 0,0036%.
1.1.- Poner a prueba la hipótesis de que en este campo la concentración media de glucósidos en
las orugas es menor que la media previamente estimada. Calcular el valor p de la prueba.
1.2.- Indicar en qué consisten el error de tipo I y el de tipo II en términos del problema.
1.3.- Calcular la potencia de la prueba para la Ha: µ = 0,17, suponiendo que la varianza no se
modifica.
1.4.- Indicar cuál es la población de la que se habla y las suposiciones sobre esta población para la
validez de las estimaciones realizadas.
1.5.- Si la concentración de glucósidos de las mariposas de Punta Indio fuera de 0.18% de su
peso, estimar la cantidad de orugas que habría que examinar para detectar la disminución con una
probabilidad del 90%.
Problema 2. Las jarillas son arbustos del género Larrea característicos de la provincia
fitogeográfica del monte. La resina que producen estas plantas posee alcaloides, que funcionan
como insecticidas naturales contra los insectos desfoliadores. Se ha determinado que la
concentración media de alcaloides en Larrea divaricata es de 1.2 mg/ml de resina con una varianza
de 0,4 (mg/ml)2.
En los llanos de La Rioja se ha encontrado una población de la misma especie con plantas muy
poco desarrolladas y con las hojas muy atacadas. Los científicos proponen las dos hipótesis
siguientes como las únicas posibles:
i) Las plantas de ese lugar producen menos alcaloides.
ii) En esa zona existe una población endémica de insectos que ha desarrollado resistencia al nivel
normal de alcaloides producido por la planta.
2.1.- Ayude a esta gente, que poco sabe de estadística, a dilucidar cuál de las dos hipótesis es la
más potable, sabiendo que de una muestra de 12 plantas de esa zona se obtuvo una
concentración media de alcaloides de 1,0 mg/ml. Grafique la distribución de probabilidades del
estimador y calcule el valor p de la prueba. Concluya utilizando un nivel de significación del 5%.
2.2.- En función de la decisión tomada en el punto anterior, ¿qué error podría estar cometiendo?
2.3.- Indique las suposiciones para la validez de la prueba.
2.4.- Si la concentración media real de alcaloides de los arbustos de esa población fuese de 0.9
mg/ml, ¿cuál sería la potencia de la prueba? Exprésela en términos del problema.
Problema 3. Los murciélagos al volar localizan un objeto sólido emitiendo chillidos agudos y
escuchando el eco. Se piensa que el alcance medio máximo para este sistema de localización por
eco es de más de 6 metros. Para confirmar la hipótesis se seleccionó una muestra aleatoria de 16
murciélagos. Cada ejemplar fue soltado en un área grande y cercada, que contenía solo un
obstáculo y se anotó la distancia entre el obstáculo y el murciélago al momento del viraje. El
experimento fue repetido varias veces con cada animal, y para cada uno de ellos se determinó la
distancia media del viraje, con los siguientes resultados:
6,2 6,8 6,1 5,7 6,1 6,3 5,8 6,3 5,9 6,3 6,4 6,0 6,3 6,2 5,9 6,1
3.1.- ¿Qué conclusión puede extraerse de los datos? ¿Qué tipo de error se puede estar
cometiendo?
3.2.- Estime con una confianza del 95% la distancia media de viraje de los murciélagos.
25
habría que desinfestarlas. Para ello se toma una muestra aleatoria de 200 palomas y se encuentra
que 145 están parasitadas.
4.1.- ¿Aconsejaría, en base a estos datos, desinfestar la población de palomas de la ciudad de Bs.
As.? Grafique la distribución de probabilidades y calcule el p-valor.
4.2.- ¿En qué consisten el error de tipo I y de tipo II en este ejemplo? ¿Cuál es más peligroso?
4.3.- Indicar las suposiciones para la validez de la prueba realizada.
Problema 5. La Unidad de Plantas Aromáticas del INTA Castelar lleva a cabo un estudio a fin de
comparar dos especies de menta: Mentha piperita y M. arvensis. De las áreas sembradas con
cada una de las dos especies, se eligen al azar 15 parcelas en cada una, se cosechan en su
totalidad, y se determina por cromatografía gaseosa el rendimiento porcentual en esencia sobre el
material húmedo. M. piperita mostró un rendimiento promedio del 0.21% con un desvío del 0.08%,
mientras que para M. arvensis, el rendimiento fue del 0.25% con un desvío del 0.07%. M. piperita
ha sido cultivada históricamente por los productores de la zona.
1- Sobre la base de estos resultados y suponiendo que los rendimientos de ambas especies
se distribuyen normalmente, ¿el INTA debería recomendar a los productores cambiar de
especie a un nivel de significación del 5%?
2- ¿Cuál hubiera sido la respuesta del punto anterior si los desvíos del rendimiento de M.
piperita y M. arvensis hubieran sido 0.04 y 0.035% respectivamente?
3- ¿Cuál hubiera sido la respuesta del punto 1) si se hubieran analizado 40 parcelas para
cada especie? (suponer que no se modifican ni las medias ni los desvíos)
4- ¿Cuál hubiera sido la respuesta al punto 1 si se hubiese planteado una prueba bilateral?
5- ¿Cuál hubiera sido la respuesta al punto 3 si el nivel de significación elegido fuese del 1%?
6- Compare los resultados y explique la razón de las diferencias en las conclusiones y en los
p-valor obtenidos.
D. ordi D. deserti
Tamaño de semilla N 100 100
cosechada (mm) Xmedio 3,50 4,50
s 2,00 2,50
Distancia del N 6 5
arbusto ∑x 284 348
a la guarida (cm) ∑x2 14 472 25 163
Con los resultados obtenidos, comentar qué estrategias siguen las dos especies para evitar la
competencia. Calcular el valor p de la prueba.
Problema 7. Efectúe la prueba de hipótesis correspondiente a los datos del problema 3 del TP 1.
Problema 8. En base a los datos del problema 9 del TP 6 ¿difiere significativamente la proporción
de Dentaria sp florecida en ambos viveros? Indique las suposiciones necesarias para la validez de
la prueba.
26
tolerancia a la lactosa. Un grupo de investigación especula que esto podría reducir los casos de
diarrea infantil. A fin de demostrarlo, a 115 niños se les suministró yogur conteniendo B. bifidum
por un lapso de tres meses, mientras que un grupo de 120 niños fue dejado como control (¿en qué
consistiría?). Al cabo del experimento se registraron 8 casos de diarrea en el primer grupo y 12 en
el segundo. ¿Puede asegurarse, con un riesgo máximo del 5%, que la incorporación de
bifidobacterias al yogur fue efectiva? Estime con una confianza del 95% la reducción en la
incidencia de diarrea infantil.
Problema 10. En un trabajo práctico de Botánica se utilizaron seis parcelas experimentales con
dos plantas de avena cada una para estudiar el efecto promotor del crecimiento de una solución de
potasio. En cada parcela, una planta elegida al azar fue tratada con la solución de potasio y la otra
no (control). Al cabo de cierto tiempo, se midió la altura de cada planta (en cm):
Parcela 1 2 3 4 5 6
Plantas sin tratar 24,8 21,6 27,8 30,0 23,0 25,4
Plantas tratadas 22,6 21,0 29,4 39,0 20,0 26,3
¿Existen evidencias de que el potasio ejerce un efecto promotor del crecimiento? Indique en
términos del problema en qué consisten el error tipo I y tipo II. ¿Cuál de los dos podría estar
cometiendo? Indique además los supuestos para la validez de la prueba utilizada.
Problema 12. Haretche y colaboradores (2006) efectuaron una investigación a fin de determinar el
efecto del pastoreo sobre el banco de semillas de un pastizal uruguayo (Ecología Austral 16:105-
113). Con tal fin seleccionaron dos áreas de 1000 m2 cada una, una sometida a un régimen de
pastoreo moderado por ganado bovino (menos de 0.5 bovinos/ha) y otra clausurada al ganado
desde hacía 9 años. En cada parcela, con el uso de un barreno, se tomaron en puntos elegidos al
azar 10 muestras de suelo de 5 cm de profundidad y 8 cm de diámetro y se determinó la densidad
total de semillas/m2.
27
1- Identifique la variable respuesta, la
unidad experimental, cantidad de
réplicas y tratamientos. ¿Se trata de
un estudio observacional o
experimental?
2- Los investigadores obtuvieron t =
2.2. Con un nivel de significación del
5%, ¿qué podrían haber concluido?
¿Cual es la la población de
referencia?
Problema 13. Se sabe que elevados niveles en sangre de colesterol LDL son perjudiciales para la
salud. Se llevó a cabo un estudio a fin de determinar el impacto de una dieta rica en huevo sobre
los niveles de colesterol LDL en 20 individuos sanos. Los individuos fueron divididos al azar en dos
grupos: I) dieta sin huevo, II) dieta con el equivalente a un huevo cada dos días. Se midieron los
valores de LDL luego de 30 días de tratamiento (en mg/ml).
1- Identifique en el experimento la variable respuesta, la unidad experimental, cantidad de
réplicas y tratamientos. ¿Se trata de un estudio observacional o experimental?
2- Suponga que los investigadores no encontraron diferencias significativas entre ambos
grupos (nivel de significación de 5%). ¿Eso los habilita a concluir con un margen de error de
5% que la ingesta de un huevo cada dos días es inocua?
3- Se sabe que la variabilidad en los niveles de colesterol es de 3 mg/ml. ¿Cuántos individuos
deberían incluirse en la investigación para detectar un aumento en el colesterol de 4 mg/ml
con una probabilidad del 90%?
Problema 14. Se desea testear la hipótesis “el agua del lago está contaminada”. Indique cuáles
serían, en términos del problema, los dos errores posibles, cuál sería el más grave y cómo
plantearía en consecuencia las hipótesis.
28
TRABAJO PRACTICO Nº 8
ANÁLISIS DE FRECUENCIAS
Problema 1. Se cruzan dos dihíbridos con dominancia completa. Suponiendo que no existe
ligamiento, se tendrá el modelo genético:
Aa Bb x Aa Bb
F2 : 9 A-B- 3 A-bb 3 aaB- 1 aabb
que es la razón clásica de fenotipos, [Link]. En la experiencia realizada, la generación F2
presentó las siguientes frecuencias:
85 A-B- , 28 A-bb , 35 aaB- , 12 aabb
Se desea saber si esta distribución de frecuencias se aparta del modelo genético postulado.
Indicar las hipótesis, los supuestos y el valor de p de la prueba.
Resultado 1 2 3 4 5 6
Frecuencia 11 5 8 15 3 8
¿Hay evidencias de que el dado está desequilibrado? Indicar las hipótesis y decidir en base al
valor p de la prueba. ¿Qué estaría indicando este valor?
Problema 4. Un ecólogo se propone investigar si las plantas de "vara de oro" con una o más
agallas tienden a estar dispuestas al azar o se agrupan. Razona que el agrupamiento podría
sugerir que las avispas que producen las agallas recorren la mínima distancia posible. Por
consiguiente, elige un terreno en el que las varas están dispuestas uniformemente y arroja al azar
100 veces un cuadrante con el fin de contar el número de plantas con agallas por cuadrante. Los
resultados son los siguientes:
44 cuadrantes con 0 plantas con agallas
24 cuadrantes con 1 planta con agallas
18 cuadrantes con 2 plantas con agallas
14 cuadrantes con 3 plantas con agallas
Estudiar la bondad del ajuste a una distribución de Poisson. Dar el valor p de la prueba. ¿Las
agallas se encuentran agrupadas?
Estudiar la bondad del ajuste a una distribución de Poisson. Dar el valor p de la prueba.
29
Problema 6. La región noroccidental de la estepa
patagónica está sometida a un régimen recurrente
de fuego. Gittins y cols (2001) efectuaron un estudio
a fin de estimar la tasa de supervivencia post-fuego
de dos especies de coirones: Festuca pallescens y
Stipa speciosa en un pastizal ubicado en
Pilcaniyeu, Río Negro. Se tiraron puntos al azar en
distintos sectores del área y se seleccionó el resto
de coirón más cercano cada punto. Se registró la
especie a la que pertenecía y la presencia (vivo) o
no (muerto) de rebrotes. Los resultados fueron:
Festuca Stipa
Vivo 80 141
Muerto 45 42
1- Identifique individuo, variables relevadas, muestra y población. Determine si la tasa de
supervivencia post-fuego difiere entre ambas especies (α = 0.05). Resuelva aplicando la
prueba χ2 y la prueba Z para diferencia de proporciones. Compare los p-valor de ambas
pruebas y concluya.
2- Estime con una confianza del 95% la tasa de supervivencia post-fuego de coirones en el
área bajo estudio.
Problema 7. En un estudio sobre factores de riesgo en recién nacidos, se extrajo una muestra
aleatoria de 1100 recién nacidos, observándose que 178 presentaban bajo peso al nacer (menos
de 2,5 kg). Por otro lado, 270 de las madres eran fumadoras. Finalmente, la mitad de los recién
nacidos de bajo peso provenía de madres fumadoras.
1- ¿Podría afirmar en base a estos datos que el hábito de fumar constituye un factor de
riesgo en el embarazo? Indique las hipótesis, el p de la prueba y calcule el riesgo relativo
del hábito de fumar.
2- Suponga que el muestreo se efectuó de la siguiente manera: se extrajo una muestra
aleatoria de 270 madres fumadores y otra de 830 no fumadoras, y en cada caso se
determinó la presencia de bajo peso en los recién nacidos. ¿Qué cambia con respecto a la
situación anterior? ¿Podría estimar la prevalencia de bajo peso al nacer?
Problema 8.- Resuelva el problema 8 del TP7 utilizando la prueba χ². Compare los resultados con
los obtenidos en el TP7.
Hipertensión Total
EAC
Sí No
Sí 1654 1959 3613
No 299 601 900 χ² = 46.28
Total 1953 2560 4513 p=10-11
Sin embargo, cuando los datos se desagregaron para individuos menores de 50 años e individuos
mayores de 65 años de edad, los resultados fueron:
Menores de 50 años Mayores de 65 años
Hipertensión Hipertensión
EAC Total EAC Total
Sí No Sí No
Sí 552 941 1493 Sí 14 29 43
No 212 495 707 No 19 47 66
30
Total 764 1436 2200 Total 33 76 109
χ² = 10.33 p= χ² = p=
Este constituye un ejemplo de la paradoja de Simpson, que ocurre cuando la presencia de una
tercera variable influye en la relación entre otras dos variables. ¿Cómo evitarlo? ¿Cuáles serían
las conclusiones de la experiencia? Calcule el riesgo relativo de la hipertensión en EAC para los
dos grupos de edad.
Poner a prueba la hipótesis de que las especies poseen una distribución de edades semejante
(recordar que gran parte de la información de la distribución está asociada a las colas, por lo tanto
combinar sólo las edades 6 y 7 meses de ser necesario).
Problema 11. Una curandera de la zona de Pringles afirma que con ciertas yerbas cura el
empacho. En la última temporada, por ejemplo, suministró tres preparaciones diferentes a 152
paisanos empachados, a los cuales previamente separó en tres grupos al azar, con los siguientes
resultados:
Curados No curados
Revienta caballo 20 35
Yerba de pollo 22 30
Paja brava 25 20
11.1- ¿Son los tres preparados igualmente efectivos como medicamento? Estimar la probabilidad
de efectividad de cada uno.
11.2- En los clasificados del domingo la curandera afirma que sus preparados curan a 6 de cada
10 paisanos empachados. ¿Puede considerarse cierta esta afirmación?
Problema 12. Pedro dice que el veneno A es más mortífero que el B porque sobrevivieron 15
ratones tratados con B y sólo 9 tratados con A. En cambio, Juan afirma que B es más mortífero
porque murieron 18 de los ratones tratados con B mientras que murieron sólo 13 de los tratados
con A. Si los dos están hablando del mismo experimento, ¿quién tiene razón?
Uso de software
Excel: En Funciones
¾ [Link]
Proporciona el p-valor, pero deben ingresarse la matriz de FE y la de FO
31
¾ Inferencia basada en una muestra > Bondad de ajuste (Kolmogorov): Para probar
ajuste a distribución normal. Determinar la significación utilizando Tabla 7 de
Lilliefors
¾ Datos categorizados > Tablas de contingencia
32
TRABAJO PRACTICO N° 9
ANÁLISIS DE LA VARIANZA
Problema 1. Se hicieron crecer cortes de coleoptile de arveja en cultivos con auxina. El propósito
de la investigación fue probar los efectos del agregado de diversos azúcares sobre el crecimiento.
Se obtuvieron los siguientes resultados expresados en unidades oculares (1 u.o. = 0,114 mm):
33
2.1.- Identificar la unidad experimental, la variable respuesta y los tratamientos con sus niveles.
2.2.- Plantear y resolver las hipótesis planteadas en el problema. Explicar su significación en base
al valor p de la prueba.
2.3.- Suponiendo que H0 es rechazada, ¿qué otras hipótesis podrían plantearse?
2.4.- ¿Qué suposiciones se están haciendo sobre las cinco poblaciones muestreadas?
¿Cuáles son las conclusiones de la experiencia? Dato útil: SC total = 68,9376 mm2
4.1.- Antes de analizar los valores de DMO se efectuó un Anova de un factor entre los 3 grupos
para la variable edad, resultando una F=1.25. ¿Qué conclusiones extraerían de este resultado y
por qué es necesario efectuar dicha prueba?
4.2.- Por otro lado la Prueba de Bartlett para la variable DMO arrojó un χ2=0.75 y la prueba de
Lilliefors para cada grupo arrojó los siguientes valores de Dmáx: 0.118; 0.104; 0.119 para el grupo
0, 1 y 2 respectivamente. ¿Qué hipótesis se están poniendo a prueba con estos estadísticos y
cuáles son las conclusiones?
4.3.- La salida de Excel para los datos de DMO es la siguiente:
Grupos Cuenta Suma Promedio Varianza
0 43 507,4 11,8 2,25
1 57 484,5 8,5 2,89
2 25 210 8,4 2,56
ANÁLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Valor crítico
F Probabilidad
variaciones cuadrados libertad los cuadrados para F
Entre grupos <10-4
Dentro de los grupos 2,60
Total 630,84
34
¿Presentan estos datos evidencia de que el alelo estudiado podría constituir un factor de riesgo de
osteoporosis? Efectúe todas las pruebas que considere necesarias.
Problema 5. Se estudió la capacidad del compuesto 4NP para efectuar cambios en la capacidad
reproductiva de Salmonella sp. Para ello se contó el número de colonias visibles en placas
tratadas con cuatro dosis de 4NP. Los resultados obtenidos utilizando 28 placas fueron:
yi Si2
0 11 14 15 17 18 21 25 17,29 21,57
Dosis 0.3 39 43 46 50 52 61 67 51,14 98,48
(µg/placa) 1 88 92 104 113 119 120 130 109,43 238,62
3 222 251 259 283 299 312 337 280,43 1547,95
1- Como los datos incluyen recuentos de colonias, ¿puede suponerse distribución normal?
Observe la relación entre el promedio y la varianza de los tratamientos. ¿Puede suponerse
homocedacia?
2- Aplique una transformación a los datos de manera tal de satisfacer los supuestos del modelo
de Anova. Realice el análisis para los datos transformados.
6.1.- Indicar como podría ser realizada esta investigación, o sea el muestreo, el diseño
experimental, la asignación de las unidades experimentales, los tratamientos, etc.
6.2.- Comprobar los supuestos del modelo.
6.3.- Efectuar un gráfico de perfiles.
6.4.- Escribir las hipótesis nulas correspondientes a los siguientes enunciados y poner a prueba
aquellas que puedan ser evaluadas con esta experiencia:
6.4.1.- al menos un tratamiento difiere del resto
6.4.2.- los valores de proteína actúan en forma diferente.
6.4.3.- la carne vacuna y la de cerdo actúan en forma diferente.
6.4.4.- la fuente animal y la vegetal actúan en forma diferente.
6.4.5.- la carne vacuna y la de cerdo varían su efecto con el nivel de proteína.
6.4.6.- la fuente animal y la vegetal varían su efecto con el nivel de proteína.
6.5.- ¿Cuál es la conclusión biológica final?
35
Problema 7. Un laboratorio medicinal quiere lanzar un nuevo producto, supuesto antagonista de
la androsterona. Para comprobar este efecto, se midió el largo de los cuernos (en cm) de 16
capones elegidos al azar, la mitad de los cuales había sido tratada (también al azar) con esa
droga, en presencia y en ausencia de androsterona. La otra mitad fue tratada con un placebo,
también en presencia y en ausencia de la hormona. Los resultados obtenidos fueron:
7.1.- Indicar el diseño experimental, el modelo estadístico (y sus factores), las unidades
experimentales, los tratamientos y el alcance. ¿Cómo podría controlarse la homogeneidad de las
unidades experimentales?
7.2.- Estudiar los supuestos del Anova.
7.3.- Graficar los perfiles. Completar la siguiente tabla de Anova:
Grados Promedio
Origen de las Suma de Valor crítico
de de los F Probabilidad
variaciones cuadrados para F
libertad cuadrados
Antagonista 0,00136
Androsterona 0,00001
Interacción 2,25 2,25 0,35760
Dentro del grupo 2,4583
Total 195
Problema 8: Las radiaciones ionizantes utilizadas con fines terapéuticos tienen efectos
secundarios a nivel vascular, como daño endotelial, fibrosis, etc. Se sospecha además que
estos efectos pueden ser más profundos si se combinan con hipercolesterolemia. A fin de
estudiarlo, se utilizaron 120 ratones que se dividieron en 3 grupos de igual tamaño. Un
grupo fue sometido a una irradiación de 4 Gy, otro a una de 8 Gy, mientras que el resto fue
sometido a una simulación de irradiación. Luego de este tratamiento, cada grupo de ratones
fue divido en forma balanceada y mientras que un grupo fue alimentado en forma estándar,
al restante se lo alimentó con una dieta rica en grasas. El tratamiento se prolongó durante
18 semanas, al cabo de las cuales los ratones fueron sacrificados, la aorta extraída y
analizada histológicamente. En cada corte se determinó el área aórtica lesionada (en µm2).
Los resultados fueron:
36
Tabla de medias: Radiación F de V SC
Dieta 0 Gy 4 Gy 8 Gy Radiación 45.896
Estándar 0.20 0.21 0.22 Dieta 299.568
Rica en grasas 1.80 3.51 4.80 error 142.08
total 1282.344
Problema 9. Se realizó una experiencia para evaluar la eficacia de los insecticidas Clordane y
Aldrin sobre la cochinilla cerúlea en ciruelos. Para ello, en un área plantada con ciruelos
atacados por cochinilla se definieron 10 sectores más o menos homogéneos en cuanto al grado
de infestación. Cada sector fue subdividido en 3 áreas, y cada una de ellas fue asignada, al azar,
a uno de los insecticidas. Se determinó el porcentaje de cochinillas adultas vivas luego de una
semana del tratamiento, con los siguientes resultados:
9.1- Indicar cuál es la variable respuesta, las unidades experimentales, los factores y sus niveles.
¿En qué cree que consiste el control?
9.2- Poner a prueba la hipótesis de no aditividad y resolver.
Datos útiles:
Prueba de no aditividad:
Datos crudos: SCNN = 1383,7592; SCerror = 3238,46; SCtotal = 26477,2
Datos transformados en logaritmos: FNN = 0,0001
9.3- ¿Qué insecticida recomendaría?
37
Comprobar las suposiciones del modelo. Poner a prueba la hipótesis de que el ritmo cardíaco
aumenta con las dosis. Comprobar las suposiciones del modelo (Dato útil: FNN = 0,9491. SCcamadas
= 10,53). Dar las conclusiones en base al valor p de la prueba.
Diseño 1 Diseño 2
SCexposiciones = 2,71 SCexposiciones = 2,98
SCplantas = 2,94 SCtotal = 4,58
SCtotal = 6,2425
Problema 12. Resolver los problemas 10 y 11 del TP 7 como un DBA. Comparar los resultados
con la prueba de t para muestras pareadas.
Problema 13. Un investigador diseñó un experimento para estudiar el efecto del pastoreo ovino
sobre la cobertura vegetal de la gramínea Stipa speciosa. Para ello distribuyó ganado ovino de
forma de generar zonas sin pastoreo, con bajo nivel de pastoreo y con alto nivel de pastoreo. Al
año siguiente (tiempo suficiente para detectar el efecto del pastoreo), ubicó 5 parcelas al azar en
cada una de las 3 zonas y registró el porcentaje de cobertura de la especie.
1- Identifique la unidad experimental, la variable respuesta, los factores y sus niveles, la cantidad
de tratamientos y la cantidad de réplicas.
2- Al analizar los datos el investigador encontró diferencias significativas entre las tres zonas.
¿Puede concluirse que el pastoreo afecta al porcentaje de cobertura medio de las gramíneas del
género Stipa?
Problema 14. Los siguientes ejemplos corresponden a diseños experimentales cuyo modelo
estadístico es un Anova. Para cada uno de ellos indicar unidades experimentales, variable
respuesta, el o los factores y sus niveles, su condición de ser fijos o aleatorios, ,los tratamientos y
el alcance. Explicar cómo podría realizarse la experiencia (sobre todo para no caer en
seudoréplicas) y en qué instancias debería intervenir el azar.
14.1.- Se esta interesado en estudiar el efecto que produce en la función pulmonar respiratoria el
hábito de fumar, en mujeres embarazadas. El tabaquismo se mide sobre la capacidad total
forzada (CTF). Para el estudio se consideran mujeres embarazadas que no fuman, que fuman
poco y que fuman mucho.
14.2.- Se quiere estudiar el efecto de la ingesta de cocaína en casos de comportamiento violento
que degenera en muerte violenta (homicidio, accidente, suicidio). Se considera como variable de
interés la concentración de cocaína (µg/ml) en sangre
14.3.- Se cree que la cantidad de luz influye sobre rendimiento de dos variedades de maíz. Se
consideran tres condiciones de luz
14.4.- Se quiere comparar el efecto de tres métodos de liberación nerviosa en individuos con
cuadro de nerviosismo agudo (individuos estresados), mediante un diseño que controle la
variabilidad individual.
14.5.- En una investigación científica se desea determinar si la actividad de cierta metaloproteasa
se ve afectada en la enfermedad de Alzheimer, en individuos adultos pertenecientes a 3 grupos de
edades.
38
14.6.- En una zona de Tierra del Fuego se quiere estudiar el efecto de la profundidad y el tipo de
suelo sobre el pH.
14.7.- Se quieren probar tres fertilizantes foliares sobre el contenido de aceite del grano de soja.
Se dispone de un campo con un gradiente de fertilidad norte-sur.
Uso de software
39
TRABAJO PRACTICO Nº 10
REGRESIÓN Y CORRELACIÓN
Problema 1. Para un estudio embriológico se desea analizar la relación entre la temperatura del
agua y el ritmo cardíaco de la rana común (Rana pipiens). Se eligen 9 ejemplares al azar y a cada
uno de ellos se le registra el ritmo cardíaco después de exponerlo a distintas temperaturas del
agua, con los siguientes resultados:
Animal 1 2 3 4 5 6 7 8 9
Temperatura (0C) 2 4 6 8 10 12 14 16 18
Frec. (latidos/minuto) 5 11 14 22 22 23 32 29 32
Datos útiles: Σx = 26700; Σy = 488; Sxx =44578750; Syy = 1074; Sxy = 191800
40
1- Indique cuál es la variable independiente y la dependiente. Halle la ecuación de la recta e
interprete la ordenada al origen y la pendiente en términos del problema.
2- ¿Se comprueba la hipótesis? Asuma un riesgo del 5%.
3- ¿Cuál será con una confianza del 95% la emisión de un auto con 5000 km? ¿Y cuál la de
un auto con 12000 km?
ANÁLISIS DE VARIANZA
Promedio
Grados de Suma de Valor crítico
de los F
libertad cuadrados de F
cuadrados
Regresión 0,003
Residuos 7381,43
Total 654666,80
Problema 4. Algunos analistas aseguran que en unas pocas generaciones las mujeres podrán
superar a los hombres en rapidez en competencias mundiales. En efecto, un análisis de records
mundiales demuestra que para numerosas distancias las mujeres han mejorado su velocidad
mucho más rápido que los hombres. Y si esto continúa, las mujeres igualarán a los hombres en
los próximos años. Sin embargo, otros investigadores dudan de estas proyecciones ya que
aseguran que en el futuro la velocidad de las mujeres mejorará más lentamente. A continuación
se dan los tiempos (en seg) de los ganadores de los 200 m llanos en carreras olímpicas:
41
1920 Allan Woodring, USA 22
1924 Jackson Scholz, USA 21.6
1928 Percy Williams, Canadá 21.6
1932 Eddie Tolan, USA 21.2
1936 Jesse Owens, USA 20.7
1948 Mel Patton, USA 21.1 F. Blankers-Koen, Holanda 24.4
1952 Andrew Stanfield, USA 20.7 Marjorie Jackson, Australia 23.7
1956 Bobby Morrow, USA 20.6 Betty Cuthbert, Australia 23.4
1960 Livio Berruti, Italia 20.5 Wilma Rudolph, USA 24.0
1964 Harry Car, USA 20.3 Edith McGuire, USA 23.0
1968 Tommie Smith, USA 19.83 Irena Szewinska, Polonia 22.5
1972 Valeri Borzov, URSS 20.00 Renate Stecher, E. Alemania 22.40
1976 Donald Quarrie, Jamaica 20.23 Barbel Eckert, E. . Alemania 22.37
1980 Pletro Mennes, Italia 20.19 Barbel Wockel, E. . Alemania 22.03
1984 Carl Lewis, USA 19.80 Valerie Brisco-Hooks, USA 21.81
1988 Joe Deloach, USA 19.75 Florence Griffith-Joyner, USA 21.34
1992 Mike Marsh, USA 20.01 Gwen Torrence, USA 21.81
1996 Michael Johnson, USA 19.32 Marie-Jose Perec, Francia 22.12
2000 Konstantinos Kenteris, Grecia 21.84 Marion Jones, USA 21.84
2004 Shawn Crawford, USA 19.79 Verónica Campbell, Jamaica 22.05
1- Construya un diagrama de dispersión de las marcas para los 200 m llanos según el año
para los datos de los hombres. Construya un diagrama aparte para las mujeres.
2- Calcule el coeficiente de determinación para hombres y mujeres. ¿Cuál de los dos sexos
exhibe un mejor ajuste?
3- Calcule la recta de regresión para los hombres. Grafíquela sobre el diagrama de
dispersión. Idem para las mujeres.
4- Interprete la pendiente en ambos casos. ¿Se verifican las aseveraciones de los analistas?
5- Utilice las rectas de regresión para hombres y mujeres para efectuar predicciones de las
marcas en los 200m llanos para las Olimpíadas de 2000, 2004 y 2008. Compare con los
datos de 2000. ¿A qué se deben las diferencias?
6- En los juegos olímpicos de Atlanta de 1996, Michael Johnson marcó 19.32 seg en los 200
m llanos. Calcule la predicción de 1996 para calcular el residuo de la marca de Johnson.
Ahora calcule en las mujeres la predicción para 1988, cuando Florence Griffith-Joyner
marcó 21.34 seg. Calcule el residuo para la marca de Joyner. Utilice los dos residuos
calculados para concluir cuál de las dos marcas fue más “sorprendente”.
7- Construya un tercer gráfico con los datos de las marcas masculinas junto con las
femeninas y trace ambas líneas de regresión.
8- Utilice el gráfico para determinar en qué año las mujeres y los hombres correrán los 200 m
llanos en el mismo tiempo. ¿Qué opina acerca de esta proyección?
Nota: datos similares a estos se discutieron en el artículo de Totem et al, publicado en Nature
(2004) 431(7008):525
42
Problema 6. Los datos que se dan a continuación corresponden a cuatro conjuntos de
datos conocidos como el cuarteto de Anscombe (1973). Para cada serie calcular:
1- La media de las X y su desvío estándar
2- La media de las Y y su desvío estándar
3- El coeficiente de determinación
4- La recta de regresión
5- El análisis de varianza para la regresión
Graficar e interpretar los resultados obtenidos, determinando si alguna serie de datos se
ajusta realmente a un modelo de regresión lineal simple.
43
Gráfico de los residuales Gráfico de los residuales
datos originales datos transformados x´=log(x)
10
8
8
6
6
4 4
Residuos
Residuos
2 2
0
0
0 0,2 0,4 0,6 0,8
-2 -0,8 -0,6 -0,4 -0,2 0
-2
-4
-6 -4
-8 -6
Absorbancia Absorbancia
7.4.- La transformación hecha en (7.2), ¿obliga a modificar las suposiciones para la validez del
modelo de regresión lineal aplicado? ¿Por qué?
7.5.- ¿Qué densidad óptica se podrá esperar si se agregan 0,3 unidades de nutriente? ¿Y si se
agregan 0,8? Decida cuál es el mejor modelo para efectuar las predicciones.
8.1.- Representar los datos con la recta de regresión ajustada a las medias. Interpretar los
resultados.
8.2.- Completar la tabla de Anova:
Estimar la regresión del peso de los adultos en la densidad larval. Indicar las hipótesis.
Ayuda: SC error = Σ (Ni-1) si2; Σx= 5409; Σy= 390.49; ∑x2=108133; b= -0,0246
Problema 9. Se desea estudiar las curvas de respuesta a los logaritmos de las dosis 2,5, 5, 10 y
20 g/día de vitamina B2 en ratas destetadas e inyectadas diariamente. Para ello, a cada una de
44
las ratas utilizadas se le determina la tasa de crecimiento (en g/semana) durante las cuatro
semanas que dura la experiencia. Los resultados obtenidos son:
Problema 10. Resolver el problema 2 del trabajo práctico 9 utilizando un modelo de regresión
lineal simple. ¿Qué ventaja ofrece este abordaje con respecto al anova de un factor?
Problema 11. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad
corporal para absorber hierro y plomo. Participan en el estudio 10 sujetos. A cada uno se le da
una dosis oral idéntica de hierro y plomo. Después de 12 días se mide la cantidad de cada
componente retenida en el sistema corporal y, a partir de ésta, se determina el porcentaje
absorbido por el cuerpo. Se obtuvieron los siguientes datos:
Individuo 1 2 3 4 5 6 7 8 9 10
% de hierro 17 22 35 43 80 85 91 92 96 100
% de plomo 8 17 18 25 58 59 41 30 43 58
¿Se encuentran relacionadas la absorción de estos dos metales pesados? ¿De qué manera?
Problema 12. Para estudiar el efecto de las aguas residuales de alcantarillas que afluyen a un
lago, se toman medidas de la concentración de nitrato de plata. Para monitorear la variable se usa
habitualmente un método manual. Se prueba un método automático, que es más sencillo de
utilizar. Se toman 10 alícuotas de agua y se analizan por ambos métodos. Los datos, en
microgramos de nitrato de plata/ litro de agua, son los siguientes:
Problema 13. Se llevó a cabo un ensayo en un campo experimental ubicado en Venado Tuerto.
Se sembró soja, variedad DM 4800, buscándose una densidad de 300000 plantas/ha. Del área
sembrada se eligieron al azar 28 parcelas de 2m2 cada una, que se cosecharon a mano y luego
se trillaron. Las variables analizadas fueron el rendimiento, expresado en kg/ha, peso de 1000
granos (P1000), cantidad de chauchas por planta, cantidad de plantas/ha, cantidad de granos/ha,
contenido de aceite (en %) y contenido de proteína (en %). Se obtuvo la siguiente matriz de
correlación (en negrita las correlaciones significativas):
45
ACEITE PROT P1000 PLANTA CHAUCHA GRANOS RINDE
ACEITE 1.000
PROT -0.698 1.000
P1000 0.346 -0.270 1.000
PLANTA -0.258 0.143 -0.190 1.000
CHAUCHA 0.467 -0.524 0.207 -0.381 1.000
GRANOS 0.344 -0.431 -0.003 -0.115 0.143 1.000
RINDE 0.445 -0.510 0.388 -0.077 0.431 0.775 1.000
Problema 14. Se realiza un estudio con el fin de detectar alguna relación entre la edad de una
madre primeriza y el peso de su bebé.
Diseño 1: Se toman al azar 10 madres primerizas en cada uno de cinco grupos de edades
crecientes y se registran los pesos de sus bebés:
a) ¿Cómo se estudiaría una posible relación funcional? Indicar el modelo y las variables a
considerar.
b) Si para la significación del modelo propuesto resultó un valor p=0,038, ¿qué se decide? Indicar
la hipótesis puestas a prueba.
Diseño 2: Se toma una muestra de 50 madres primerizas y se registra su edad y el peso de sus
bebés.
a) ¿Cómo se estudiaría la relación entre ambas variables? Indicar el modelo y los supuestos para
su validez.
b) Si para la significación del modelo resultó un valor p= 0,10, ¿qué se decide? Indicar las
hipótesis a probar.
Uso de software
46