UNIVERSIDAD DE SAN CARLOS DE GUATEMALA
CENTRO UNIVERSITARIO DE OCCIDENTE
DIVISIÓN DE HUMANIDADES Y CIENCIAS SOCIALES
TRABAJO SOCIAL
OCTAVO SEMESTRE
Texto paralelo.
Nombre
Jennifer Yulisa López Sales 201831897
QUETZALTENANGO, 3 DE NOVIEMBRE DEL 2022
Que conozco de estadística
Son un conjunto de datos que permiten conocer la realidad a partir de la
cuantificación numérica sobre los problemas que tiene mayor porcentaje, dentro de
la estadística se utiliza el análisis, interpretación, y presentación, etc.
Que no conozco de estadística
Como graficar a partir de la estadística.
Qué experiencia agradable o desagradable he experimentado con estadística.
El no conocer la importancia de la estadística dentro del que hacer el trabajador
social fue una limitación porque no tenía el conocimiento de poder hacer un análisis
a partir de datos numéricos.
Concepto.
La estadística consiste en métodos, procedimientos y fórmulas que permiten
recolectar información para luego analizarla y extraer de ella conclusiones obtienes
con colusiones a partir de datos numéricos que proporcionan información, entonces
se ocupa de la recolección, organización, análisis y presentación de los resultados
conceptos. Cómo mentir con la estadística
Origen:Statistik del italiano statista entonces Gollfired Anchewall (1719-1772) Dr.
A.W. Zimmer man introdujo el término satatisties en Inglaterra.
La estadística se divide en Descriptiva e inferencial.
Estadística descriptiva: Describe el desempeño de la información.
Estadística inferencial: realiza generaliza las afirmaciones con respecto a la
probabilidad y a su validez.
Importancia de la distribución normal:
Hay dos razones.
1) tiene algunas propiedades que la hacen aplicable a un gran número de
situaciones en las que es necesario hacer inferencia mediante la toma de muestra.
2) La distribución normal casi se ajusta a las distribuciones de frecuencia reales
observadas en muchos fenómenos, incluyendo características humanas (peso,
altura, coeficiente, intelectual) resultados de procesos físicos (dimensiones y
rendimientos) y muchas otras medidas de interés social.
Medidas de tendencia central. Media aritmética: Datos no agrupados.
2 Ejemplos
1. La Komen Race for the Cure Series es la serie de carreras de 5.000 metros
más multitudinaria del mundo. La Susan G. Komen Breast Cancer Foundation
recauda fondos para financiar la lucha contra el cáncer de mama y para darla
a conocer; apoya los proyectos de educación, selección y tratamiento en
comunidades de todo el mundo; alaba a las mujeres que han sobrevivido y
honra a las que han perdido la batalla contra la enfermedad. Halle las
medidas de la tendencia central de una muestra de cinco tiempos (en
minutos) que hicieron los participantes en una reciente Race for the Cure: 45,
53, 45, 50, 48
Solución 1:
a) Media
Para calcular la media se deben sumar todos los datos ingresados y dividirlos entre
el total de datos.
b) Mediana
Para calcular la mediana, se debe ordenar el conjunto de datos de forma
ascendente e identificar el valor en la posición central. Si la cantidad de datos
evaluados es impar, la mediana es el valor intermedio. Si la cantidad de datos es
par, la mediana es el promedio de los números del medio. Es así que para los
valores ingresados tenemos:
Posición 1 2 3 4 5
Valor 45 45 48 50 53
Dado que la cantidad de datos (N=5) es impar, solo tenemos un valor intermedio
que se encuentra ubicado en la posición 3. Por lo tanto, la mediana es 48
c) Moda
La moda es el número (o los números) con mayor frecuencia en el conjunto de
datos. Si todos los valores tienen la misma frecuencia se considera que el conjunto
de datos no tiene moda.
Valor Frecuencia
45 2
48 1
50 1
53 1
La moda del conjunto de datos es 45
2. En una muestra aleatoria de ocho empresas estadounidenses, los beneficios
por acción han experimentado este año las siguientes variaciones
porcentuales en comparación con el año pasado:
0% 0% 8,1% 13,6% 19,4% 20,7% 10,0% 14,2%
Calcule la media, la moda y la mediana
Solución 2:
a) Media
Para calcular la media se deben sumar todos los datos ingresados y dividirlos entre
el total de datos:
b) Mediana
Para calcular la mediana, se debe ordenar el conjunto de datos de forma
ascendente e identificar el valor en la posición central. Si la cantidad de datos
evaluados es impar, la mediana es el valor intermedio. Si la cantidad de datos es
par, la mediana es el promedio de los números del medio. Es así que para los
valores ingresados tenemos:
2 3 4 5 6 7 8
Posición 1
0 8.1 10 13.6 14.2 19.4 20.7
Valor 0
Dado que la cantidad de datos (N=8) es par, existen dos números intermedios, que
se encuentran ubicados en las posiciones 4 y 5. Estos valores son 10 y 13.6. Por lo
tanto, la mediana será el promedio de ambos números:
c) Moda
La moda es el número (o los números) con mayor frecuencia en el conjunto de
datos. Si todos los valores tienen la misma frecuencia se considera que el conjunto
de datos no tiene moda.
Valor Frecuencia
2
0
10 1
8.1 1
13.6 1
14.2 1
19.4 1
20.7 1
La moda del conjunto de datos es 0
Cuándo se describen las características de una población se llama parámetros. Es
una característica de una población.
Se puede utilizar estadísticas, para estimar parámetros.
En estadística se emplean literales latinas minúsculas para representar los símbolos
de la muestra y literales griegas o latinas mayúsculas para representar parámetros
de la población.
La medida y la desviación estándar, punto, tipos de variables Qué es una variable
son características de una muestra o población de datos que puede adoptar
distintos valores
a. Variables cuantitativas: discretas y continuas.
b. Variables cualitativas: categóricas o nominales, ordinales y dicotomías.
Distribución normal.
Propósito:
General: Interpretar los indicadores de comportamiento de una distribución
normal en la resolución de problemas del ámbito educativo.
Identificar las características de la distribución normal.
Comprender el proceso de estandarización de una distribución normal.
Reconocer las aplicaciones de la curva normal z en la medición de
fenómenos educativos.
Aplicar el proceso de estandarización de una distribución normal para
resolver problemas del ámbito educativo.
Al comenzar un análisis estadístico se debe tener en cuenta:
En un primer paso, describir la distribución de las variables estudiadas y en
particular, de los datos numéricos.
Además de las medidas descriptivas
correspondientes, el comportamiento de estas variables puede explorarse
gráficamente de un modo muy simple.
Curva de la distribución normal.
La distribución normal fue reconocida por primera vez por el Francés Abraham de
Moivre (1667-1754). Posteriormente Carl Friedrich Gauss (1777-1855) elaboró
desarrollos más
profundos y elaboró la ecuación de la curva de ahí que también se le conozcacomo:
La distribución de una variable normal está completamente determinada por dos
parámetros:
Propiedades de la Distribución Normal.
Tiene una única moda, que coincide con su media y su mediana. La curva normal es
asintótica al eje de abscisas. Por ello, cualquier valor entre -∞ y ∞ es teóricamente
posible. El área total bajo la curva es, por tanto, igual a 1.
Es simétrica con respecto a su media μ. Según esto, para este tipo de variables
existe una probabilidad de un 50% de observar un dato mayor que la media, y un
50% de observar un dato menor.
La distancia entre la línea trazada en la media y el punto de inflexión de la
curva es igual a una desviación típica(δ).
El área bajo la curva
aproximadamente:
⮚ A una desviación estándar de la media es igual 0.68
⮚ A dos desviaciones estándar de la media es igual a 0.95
⮚ A tres desviaciones estándar de la media es igual a 0.99
La forma de la campana de Gauss depende de los parámetros
μ y δ.
La media indica la posición de la campana, de modo que para
diferentes valores de μ, la gráfica es desplazada a lo largo del eje horizontal.
La desviación estándar determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor de δ, más se dispersarán los
datos en torno a la media y la curva será más plana.
Distribuciones normales con diferentes medias e igual desviación estándar.
Distribuciones normales con distinta desviación estándar e igual media.
Aplicaciones de la Distribución Normal.
Es importante conocer que a 21 partir de una distribución N(μ,δ)
⮚ Se puede obtener una distribución normal estándar efectuando la siguiente
transformación:
Z(0,1)
Z= (X - μ) /δ
Por ejemplo podríamos desear saber la probabilidad de que
alguna variable X aleatoria distribuida normalmente en forma
aproximada, con media: μ y desviación estándar: δ; asuma valores
comprendidos entre un intervalo: (a,b).
Para obtener dichas probabilidades transformamos la variable X con
media μ y desviación estándar δ , en la variable normal estándar, Z con media 0 y
desviación estándar 1. Esto lo hacemos por medio de la fórmula:
Se puede obtener una distribución normal estándar efectuando la
siguiente transformación.
z = (x- μ) / δ:
Se puede obtener el número “x” que corresponde a un
valor “z” con la siguiente transformación:
x= (δ *z) + μ.
Ejemplo:
Los puntajes de una prueba de aptitud escolar están normalmente
distribuidos con una media de 600 y una varianza de 10000 (es decir
δ=100)?
• A)¿Qué proporción de los encuestados tiene un puntaje por debajo
de 300?
• B) Una persona va a presentar una prueba, que probabilidad tiene de
obtener un puntaje de 850 o más?
• C) ¿Qué proporción de puntajes estará entre 450 y 700?
Ejemplo.
1. La estatura de mujeres en cierta ciudad tiene una distribución normal con
media de 160 cm y desviación estándar de 2 cm. ¿qué porcentaje de mujeres
de esta región y tiene una estatura entre 150 y 163 cm?
Datos:
Media: μ = 160 cm.
Desviación estándar: Ds = 2 cm.
P(158 < X < 163) = ¿?
Procedimiento.
2. Los precios de las acciones de cierta industria se distribuyen en forma
normal con una media de $20 y desviación estándar de $3 ¿Cuál es la
probabilidad del precio de las acciones de una empresa de esta industria que
se encuentre en $18 y $20 ?
TEORÍA DEL MUESTREO.
Razones para realizar muestreo: Para poder determinar las características del todo,
se tiene que muestrear solo una porción.
La mejor idea es localizar una muestra representativa y entrevistarla con el fin de
generalizar con respecto a todo el grupo.
El tiempo también es un factor importante, cuando se desea obtener información
rápidamente, para ajustar una operación o modificar una política.
Se pueden tomar muestras a intervalos específicos. Censo: Algunas veces es
posible y práctico 4 examinar a cada persona o elemento de la población que se
desea describir. A esta acción se le conoce como enumeración completa o censo.
Los especialistas en estadística utilizan la palabra población, para referirse no sólo a
personas, sino a todos los elementos que han sido escogidos para su estudio.
Muestra.
Se recurre al muestreo cuando no es posible contar o medir todos los elementos de
la población.
Los especialistas en estadística utilizan la palabra muestra, para describir una
porción escogida de la población.
¿Que es una Muestra?
1. Una muestra es un subconjunto de la población.
2. El número de elementos o sujetos que componen la muestra representativa de
una población
3. Es representativa porque tiene “nivel de confianza y margen de error”
4. Permite inferir los resultados a la población.
FUNCIÓN DE LA ESTADÍSTICA Y LOS PARÁMETROS
Matemáticamente se puede describir muestras y poblaciones al emplear mediciones
como la media, la mediana, la moda y la desviación estándar. Cuando estos
términos describen las características de una muestra, se denominan estadísticas.
Una estadística es una característica de una muestra.
Características de una población:
Cuando se describen las características de una población, se llaman parámetros.
Un parámetro es una característica de una población. Se pueden utilizar
estadísticas, para estimar parámetros.
En estadística se emplean literales latinas minúsculas para representar los símbolos
de la muestra y literales griegas o latinas mayúsculas para representar parámetros
de la población. La media (u) y la desviación estándar (σ)
VARIABLES Y TIPOS DE VARIABLES:
¿QUÉ ES UNA VARIABLE? Son características de una muestra o población de
datos que puede adoptar distintos valores.
a. Variables cuantitativas: Discretas y continuas.
b. Variables cualitativas: categóricas o nominales, ordinales y dicotomías.
Variables cualitativa categórica o nominal:
Es la variable no numérica que presenta tres o
mas categorías. La afinidad de un equipo: Xelaju.
Los deportes olímpicos: Natación, voleibol.
Los estados de la materia: Solido, liquido y gaseoso.
Las carreras universitarias: Derecho, Trabajo Social, económicas.
VARIABLE CUALITATIVA DICOTÓMICA:
Es un dato no numérico que presenta una cualidad, propiedad o condición
observable, que nada más presenta dos valores. El género es una variable
cualitativa que puede tomar dos valores: M o F El veredicto de un jurado: culpable o
no culpable El resultado de una prueba de antígeno + o –
El tipo de un hospital: publico o [Link] ORDINALES:
Los valores pueden ordenarse, de menor a mayor, de mas importante a menos
importante, de primero a último, etc. Clase social: alta, media, baja. Nivel que se
posee de un idioma: básico, intermedio y avanzado. Niveles de educación, pre
primaria, primaria,básico.
TIPOS DE MUESTREO:
Existen dos métodos para seleccionar muestras
de poblaciones:
El muestreo no aleatorio o de juicio: Se emplea el conocimiento y la opinión
personal para identificar a los elementos de la población que deben incluirse en la
muestra. Se basa en la experiencia de alguien de la población. Se usa como guía o
muestra tentativa para decidir cómo tomar una muestra aleatoria más.
adelante.
El muestreo aleatorio o de probabilidad: Todos los elementos de la población
tienen la oportunidad de ser elegidos para la muestra. El riguroso análisis
estadístico que puede llevarse a cabo a partir de muestras aleatorias, no puede
ser efectuado con muestras de juicio.
Muestras sesgadas: Es cuando se elige a personas que tienen un fuerte interés en
el asunto.
Muestreo Aleatorio o de probabilidad:
Es la posibilidad de que un elemento de la población se incluya o no en la muestra,
hay cuatro métodos del muestreo aleatorio:
1 Muestreo Aleatorio simple.
2 Muestreo sistemático.
3 Muestreo estratificado.
4 Muestreo de racimo o conglomerado
Muestreo Aleatorio simple:
Selecciona muestras mediante métodos que permiten que cada posible muestra
tenga una probabilidad igual de ser seleccionada y que cada elemento de la
población total tenga una oportunidad de ser incluido en la muestra.
Población finita: muestreo con remplazo y sin remplazo. (A, B, C Y D = 1/6)
Población infinita: Cómo hacer un muestreo aleatorio: La forma
más fácil es utilizar los números aleatorios.
1. Una empresa tiene 70 empleados. Se quiere extraer una muestra de 10
de ellos.
N= 70
n= 10
1. 23.38=23
2. 42.56=43
3. 49.84=50
4. 24.08= 24
5. 26.18= 26
6. 42.49= 42
7. 17.5= 17
8. 41.02= 41
9. 29.68= 30
10. 57.61 = 68
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40
41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60
61 62 63 64 65 66 67 68 69 70
En una organización de 50 empleados, si el equipo de recursos humanos decide
llevar a cabo actividades de creación de equipos, es muy probable que prefieran
escoger fichas de un tazón. En este caso, cada uno de los 50 empleados tiene la
misma oportunidad de ser seleccionado. Se pretende seleccionar a 8 empleados
para obtener respuestas claras de una encuesta.
N =50
n=8
1. 30.2=30
2. 36= 36
3. 40.75= 41
4. 2.95=3
5. 32.85=33
6. 31.15= 31
7. 21.4= 21
8. 26= 26
1. 2. 3. 4. 5.
6. 7. 8. 9. 10.
11. 12. 13. 14 15.
16. 17. 18. 19 20.
21. 22. 23. 24 25.
26. 27. 28. 29 30.
31. 32. 33. 34 35.
36. 37. 38. 39 40.
41. 42. 43. 44 45.
46. 47. 48. 49 50.
1. Con las siguientes 20 edades tomadas de un grupo de jóvenes, obtenga
mediante un más una muestra tamaño 5.
18 17 19 17
19 17 18 19
18 19 18 19
20 18 20 19
19 20 22 21
N= 20
n= 5
1. 8.92=9 4. 0.88=1
2. 6.64=7 5. 15.2=15
3. 11.9=12
Muestreo sistemático:
Los elementos son seleccionados de la población dentro de un intervalo uniforme
que se mide con respecto al tiempo, al orden o al espacio. Tiene la ventaja de que
puede requerir menos tiempo y tiene un menor costo.
1. Se acerca la Navidad y ciertas empresas de torreones creen que no va
a poder entregar todos los pedidos a tiempo a no ser que aumente la
plantilla, la empresa dispone de un listado ordenado alfabéticamente de
20 personas con las mismas características para el puesto y que
actualmente están en par, puesto que el tiempo apremia y no es posible
hacer una entrevista para seleccionar al personal se decida elegir cinco
trabajadores de forma aleatoria usando el muestreo sistemático.
Muestreo Probabilístico Sistemático.
K=N/n K=10/5=4
1 11
2 12
3 13
4 14
5 15
6 16
7 17
8 18
9 19
10 20
2. De un listado de 25 personas desean una muestra de 8 personas
mediante un muestreo aleatorio sistemático, describe el proceso.
K=N/n K=25/8=3.125 3
1 11 21
2 12 22
3 13 23
4 14 24
5 15 25
6 16
7 17
8 18
9 19
10 20
3. Supongo que estamos investigando sobre el porcentaje de estudiantes
que trabajan en una población de 20 estudiantes. La base de datos de la
población es:
No Nombre del ¿Trabajan? No. Nombre del ¿Trabajan?
. alumno alumno
1 Juan Si María No
Alicia No Fernanda No
Pedro No 4 Julio Si
Marcos No Rosa No
2 Alberto Si Fabian No
Jorge Si Ana No
Josué No 5 Laura No
Carlos No Enrique No
3 Miguel No Carlos Si
Victoria Si Marcelo Si
Seleccionar una muestra de 5 estudiantes usando el muestreo sistemático y
considerando un arranque A=1
K=N = 20 =4
n 5
A=1
1 +k=1+4=5
5 +k=5+4=9
9 +k=9+4=13
13+k=13+4=17
Los 5 estudiantes son: Juan, Alberto, Miguel, Julio y Laura
Muestreo sistemático: Ejemplo: Población (N) 12000
Muestra requerida (n) 600
Calcular el intervalo del muestreo:
(k) = 12000/600 = 20
Escoger el primer número al azar [1 – 20] Añadir k para escoger la siguiente unidad
y así sucesivamente hasta completar n.
Muestreo estratificado:
Se divide a la población en grupos relativamente homogéneos, llamados estratos,
garantiza que cada elemento de la población tenga la posibilidad de ser
seleccionado. Se utiliza cuando la población ya está dividida
en grupos de diferentes tamaños. La ventaja es que reflejan de manera más precisa
las características de la población que fue elegida. Estudiantes de la carrera de Ts.
Ejemplos
1. En cierta cadena de centros comerciales trabajan 150 personas en el
departamento de personal, 450 en el departamento de ventas, 200 en el
departamento de contabilidad y 100 en el departamento de atención al
cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar
una muestra de 180 trabajadores.
¿Qué tipo de muestreo deberíamos utilizar para la selección de la muestra si
queremos que incluya a trabajadores de los cuatro departamentos
mencionados?
¿Qué número de trabajadores tendríamos que seleccionar en cada
departamento atendiendo a un criterio de proporcionalidad?
¿Qué tipo de muestreo deberíamos utilizar para la selección de la muestra si
queremos que incluya a trabajadores de los cuatro departamentos
mencionados?
Se utilizara un muestreo aleatorio estratificado, que se quiere hayar representantes
de cada uno de los departamentos, se tomara una muestra significativa que
represente la proporción de empleados que hay en cada departamento.
Qué número de trabajadores tendríamos que seleccionar en cada departamento
atendiendo a un criterio de proporcionalidad?
Para poder elegir una cantidad proporcional de cada departamento, primero
debemos conocer la proorción que tendrá el tamaño de la muestra respecto a la
totalidad de trabajadores, esto es:
2. En un preparatorio de secundaria hay cuatro salones de clase, cada
salón tiene diferente número de estudiantes. Con un total de 112 ,
teniendo una muestra de tamaño 10. ¿Calcular la muestra de estratos
para cada salón de claro?.
Salón Número de estudiantes Porcentaje %
A 20 17.85=1.785=2
B 30 26.78= 2.678=3
C 35 31.25= 3.125=3
D 27 2.41=2.41= 2
Total 112 R. 10
Procedimiento
1. Población = 112
Salón A= 20.
Porcentaje 100%
Aplicar la regla de tres.
Multiplicar el 20 por 100 y lo dividimos entre 112 en total 17.85
17.85 se divide entre 100 luego se multiplica por 10 que es el total de
la muestra y se coloca el resultado.1.785=2
2. Población = 112
Salón A= 30.
Porcentaje 100%
Aplicar la regla de tres.
Multiplicar el 30 por 100 y lo dividimos entre 112 en total 26.78.
26.78 se divide entre 100 luego se multiplica por 10 que es el total de
la muestra y se coloca el resultado.2.678=3
3. Población = 112
Salón A= 35.
Porcentaje 100%
Aplicar la regla de tres.
Multiplicar el 35 por 100 y lo dividimos entre 112 en total 31.25
31.25 se divide entre 100 luego se multiplica por 10 que es el total de
la muestra y se coloca el resultado 3.125=3
4. Población = 112
Salón A= 27
Porcentaje 100%
Aplicar la regla de tres.
Multiplicar el 27 por 100 y lo dividimos entre 112 en total 2.41
2.41 se divide entre 100 luego se multiplica por 10 que es el total de la
muestra y se coloca el resultado 2.41= 2.
Muestreo de racimo:
Divide a la población en grupos o racimos, se asume que cada uno de ellos es
representativo de la población. Puede producir una muestra más precisa a un costo
menor. Los grupos son esencialmente similares. (Humanidades, Económicas).
Muestreo de racimo
1. Si tiene una población de 2150 personas que se entrevistaron para ver
si están o no a favor del candidato a presidente municipal se pretende
conocer la aceptación del candidato A través de una muestra ¿Cuál
debe ser el tamaño mínimo de la muestra que cumpla con un error
estándar de 0.02 y una confiabilidad de 90%?
Solución
Error estandar= 0.02
P=0.9
(l-p)=0.1.
p*=(0.9)(0.1)/(0.02)2=225
n≥ 225/ 1+ 225/2150
Respuesta n≥ 201 personas
2. una casa farmacéutica prepara 100 lotes de medicamento el cual
contiene: 15 cajas de aspirina, 10 cajas de acetaminofén, 5 cajas de
ibuprofeno, se desean analizar 80 cajas de cada medicamento calcular
n’ y r.
15 cajas de aspirina
n’= 80 ÷ 15 r= 100 ÷ 5
n’= 5.33>5 r= 20 lotes
10 cajas de acetaminofén
n’= 80 ÷ 10 r= 100 ÷ 8
n’= 8 lotes r= 12.5 > 12
5 cajas de ibuprofeno
n’= 80 ÷ 5 r= 100 ÷ 16
n’= 16 lotes r= 6.25>6
Base de la inferencia estadística:
Los muestreos intentan aproximarse al muestreo aleatorio simple. Todos son
métodos que han sido desarrollados por su precisión, economía o su factibilidad.
Los principios del muestreo aleatorio simple son la base de la inferencia estadística.
Tipos de muestreo no probabilístico:
No se conoce la probabilidad que tienen los diferentes elementos de la población de
estudio, de ser seleccionados.
1. Muestreo por conveniencia.
2. Muestreo por cuotas.
3. Muestreo accidental o de bola nieve
Muestreo por conveniencia:
Es la muestra que esta disponible en el tiempo o periodo de investigación.
Todos los pacientes que asistan a una clínica, en cierto día, semana, pueden ser
requeridos para participar. Desventaja: la muestra puede ser poco representativa de
la población que se desea estudiar.
1. Un investigador está analizando las características de los estudiantes
universitarios de medicina. Para seleccionar la muestra representativa,
escoge a algunos de los estudiantes de las universidades de su ciudad.
2. Un investigador elige tres personas de la comunidad al azar para poder
entrevistarlos y conocer cuáles son las producciones agrícolas que se dan
en el lugar.
3. en el centro escolar Cristobal Colon. El director Oscar Perez selecciona
a los 10 alumnos más sobresalientes de la sección A de 3ro básico de la
institución para realizar una evaluación que determinará el promedio de
dicha institución a nivel departamental en la materia de matemática.
En la sección hay 30 alumnos.
estrato promedio cantidad porcentaje
1 80 - 100 10 33%
2 60 - 79 15 50%
3 45 - 59 5 17%
De esta forma quedan establecidos los diferentes estratos dentro de una población
global de 30 estudiantes .
En el Estrato 1 tenemos 10 estudiantes con promedios de 80 - 100 puntos el cual.
Representan el 33%. esto quiere decir que solamente el 33% de la sección A son
los más sobresalientes.
En el Estrato 2 hay 15 estudiantes con promedios entre los 60 - 79 puntos Son el
50% esto quiere decir que el 50% de los estudiantes tienen baja calificación.
En el Estrato 3 hay 5 estudiantes con edades con calificaciones de 45 - 59 ellos
Representan el 17% del total esto quiere decir que el 17% de los estudiantes tienen
dificultades en su aprendizaje y no tienen buen rendimiento académico.
El director solamente tomó a conveniencia a los 10 alumnos para manipular la
muestra.
Muestreo por cuotas:
1. Todos los elementos conocidos de la población tienen que aparecer en la
muestra.
Se debe asegurar que estos aparezcan en la misma proporción que en la población.
El investigador entrevistas a todas las personas de cada categoría que pueda
encontrar hasta que haya llenado la cuota.
El Director de una empresa tecnológica con 500 empleados (población) quiere
investigar sobre el uso de un nuevo software entre la plantilla. Para ello, divide a los
trabajadores en estratos según su rango de edad.
Estrato Edad Cantidad Porcentaje
1 18 – 30 150 30%
2 31 – 60 300 60%
3 61 – 100 50 10%
De esta forma quedan establecidos los diferentes estratos dentro de una población
global de 500 empleados.
En el Estrato 1 tenemos 150 trabajadores con edades comprendidas entre los 18 y
los 30 años. Representan el 30%.
En el Estrato 2 hay 300 empleados con edades entre los 31 años y los 60. Son el
60% de la plantilla.
En el Estrato 3 hay 50 trabajadores con edades entre los 61 y los 100 años.
Representan el 10% del total.
2. De cada uno de los estratos, la persona encargada de la investigación,
elegirá por conveniencia a un número determinado. Por ejemplo,
seleccionando a 50 empleados del estrato 1, 100 empleados del estrato 2 y
20 del estrato 3. De esta forma queda conformado el muestreo por cuotas
;).
Una compañía quiere efectuar un sondeo de opinión sobre uno de sus productos.
Así, sabe que el 30% de sus clientes tiene entre 18 y 25 años, el 40% tiene entre 25
y 45 años, y el resto (30%) tiene más de 45 años.
Entonces, al momento de seleccionar la muestra estadística, que incluirá a 1.000
entrevistados, tendremos 300 jóvenes de entre 18 y 25 años (el 30% de 1.000), 400
adultos de entre 25 y 45 años, y otras 300 personas mayores a 45 años.
Muestreo accidental o de bola nieve: Se aprovecha o se utiliza a personas
disponibles en un momento dado, que corresponda con el propósito del estudio. De
los tres tipos de muestreo no probabilístico, resulta el mas deficiente.
Descripción de las distribuciones de muestreo: Cualquier distribución de
probabilidad puede ser descrita parcialmente por su media y su
desviación estándar Concepto de error estándar: El termino se utiliza porque da a
entender un significado especifico.
Ejemplo: La estatura estud. TS.
Es altamente imposible que todas las medias de la muestra sean iguales, es de
esperar alguna variabilidad en las medias observadas.
1. Un investigador decide realizar una investigación cuya muestra la conforman
individuos con una rara enfermedad. De esta manera, al encontrar un
individuo con dichas características, el investigador le pide ayuda para
encontrar otras personas con estas condiciones para conformar la muestra.
2. Si en un estudio se estuviera investigando el engaño en los exámenes, el
hurto en las tiendas, el uso de drogas o cualquier otro comportamiento social
“inaceptable”, los participantes potenciales serían cautelosos de presentarse
debido a posibles ramificaciones.
Sin embargo, es probable que otros participantes del estudio conozcan a
otras personas en la misma situación que ellos y puedan informar a otros
acerca de los beneficios del estudio y asegurarles la confidencialidad.
1. Por ejemplo, será extremadamente difícil encuestar a personas sin refugio o
inmigrantes ilegales. En esos casos, utilizando la teoría de la bola de nieve,
los investigadores pueden rastrear unas pocas categorías para entrevistar y
obtener resultados.
por ejemplo, en las encuestas para reunir información sobre el VIH y el SIDA.
No muchas víctimas responderán fácilmente a las preguntas. No obstante,
los investigadores pueden ponerse en contacto con personas que tal vez
conozcan o con voluntarios asociados a la causa para encontrar a las
víctimas y reunir información.
Concepto de error estándar:
Esta variabilidad en las estadísticas de muestras proviene de un error de muestreo
debido a que es al azar, hay diferencias entre cada muestra y la población y entre
las diversas muestras, debido únicamente a los elementos que se decidieron
escoger para las muestras.
Error estándar de la estadística.
La desviación estándar de la distribución de las medidas de las muestras mide el
grado hasta el cual es de esperar que varíen las medidas de las
diferentes muestras, debido a este error cometido en el proceso de muestreo. Por
tanto, la desviación estándar de la distribución de una
estadística de muestra, se conoce como error estándar de la estadística.
El error estándar:
Indica no solo el tamaño del error al azar que se ha cometido, sino también la
probable precisión que puede obtenerse al utilizar una estadística de
muestra para estimar un parámetro de población.
Terminología de la estadística de muestras:
Desviación estándar de la distribución de las medias de muestra = Error estándar de
la media. Desviación estándar de la dist. de proporciones de muestra = Error
estándar de la proporción. Desviación estándar de la dist. de medianas de muestra
= Error estándar de la mediana. Desviación estándar de la dist. de rangos de
muestra = Error estándar del rango.
Uso del error estándar:
Siempre que se usan pruebas, se tiene que considerar el error estándar.
Ello indicaría que tan grande tiene que ser una diferencia de las estaturas de los
estudiantes de Ts. Para que sea estadísticamente significativa.
“Cuando se usa el termino error estándar para describir una distribución se refiere a
la desviación estándar”.
1. Suponga que está tratando de estimar la proporción de personas en la
población que tienen preferencia por una fórmula láctea enriquecida, y se
desea tener un 95% de confianza en sus resultados.
Se toma una muestra de 800 personas y se determina que 560 personas en la
muestra tiene preferencia por la fórmula láctea enriquecida. Determine un intervalo
en el cual se pueda esperar se encuentre la proporción poblacional y la proporción
de otras muestras que se puedan tomar de la población, con un 95% de confianza
a) Calculemos la proporción muestral p y su complemento:
p = 560/800 = 0.70
q = 1 – p = 1 – 0.70 = 0.30
b) Se conoce que la proporción se aproxima a una distribución normal a muestras
de tamaño grande (mayores a 30). Entonces, se aplica la llamada regla 68 – 95 –
99.7 y se tiene que:
Coeficiente de confianza = z = 1.96
Error estándar = √(p*q/n)
Error estándar de estimación (EEE) = ± (1.96)*√(0.70)*(0.30)/800) = ± 0.0318
c) A partir del error estándar de estimación se establece el intervalo en el que se
espera se encuentre la proporción poblacional con un 95% de nivel de confianza:
0.70 – 0.0318 ≤ Proporción poblacional ≤ 0.70 + 0.0318
0.6682 ≤ Proporción poblacional ≤ 0.7318
2. Se puede esperar que la proporción de muestra del 70% cambie hasta en
3.18 puntos porcentuales si toma una muestra diferente de 800 individuos o
que la proporción real de la población está entre 70 – 3.18 = 66.82% y 70 +
3.18 = 73.18%.
Del total de calificaciones de matemáticas de los alumnos de primer año de
una universidad se tomó una muestra aleatoria de 50 calificaciones en la que
la media encontrada fue 75 puntos y la desviación estándar, 10 puntos.
¿Cuáles son los límites de confianza de 95% para la estimación de la media
de las calificaciones de matemática de la universidad?
a) Calculemos el error estándar de estimación:
Coeficiente de confianza del 95% = z = 1.96
Error estándar = s/√n
Error estándar de estimación (EEE) = ± (1.96)*(10√50) = ± 2.7718
b) A partir del error estándar de estimación se establece el intervalo en el que
se espera se encuentre la media poblacional o la media de otra muestra de
tamaño 50, con un 95% de nivel de confianza:
50 – 2.7718 ≤ Promedio poblacional ≤ 50 + 2.7718
47.2282 ≤ Promedio poblacional ≤ 52.7718
c) Se puede esperar que la media de la muestra cambie hasta en 2.7718
puntos si se toma una muestra diferente de 50 calificaciones o que la media
real de las calificaciones de matemática de la población de la universidad
está entre 47.2282 puntos y 52.7718 puntos
Muestreo de poblaciones normales:
La distribución de muestreo de una media de una población normalmente distribuida
demuestra las importantes propiedades.
Ejemplo:
Una institución bancaria calcula que sus cuentas de ahorro individuales están
normalmente distribuidas con una media de Q. 2000.00 y una desviación estándar
de Q. 600.00.
Ejemplo:
Si el banco toma una muestra aleatoria de 100 cuentas, ¿Cuál es la probabilidad de
que la media de la muestra caiga entre Q. 1900.00 y Q. 2050.00? Es necesario
calcular primero el error estándar de la media.
σx̄ = σ → σx̄ = 600 → σx̄ = 600
√n √100 10
σx̄ = Q. 60 el error estándar de la media.
Ejemplo:
z = x̄ – u = 2050 – 2000 = 50 = 0.83
σx̄ 60 60
Desv. Est. De la media de una dist. De prob. El área es de 0.4525 para un valor de z
de - 1.67 El área es de 0.2967 para un valor de z de 0.83
Si se suman se obtiene 0.7492 como la probabilidad total de que la media de la
muestra se encuentre entre 1900.00 y 2050.00.
Ejemplo:
z = x̄ – u = 2050 – 2000 = 50 = 0.83
σx̄ 60 60 Desv. Est. De la media de una dist. De prob.
Muestreo de poblaciones no normales:
Los responsables de tomar decisiones tienen muchas poblaciones que no están
distribuidas normalmente. ¿Cómo se debe trabajar la distribución de muestreo de la
media cuando la población de la que se extraen las muestras no es normal?
Ejemplo:
Con relación a cinco propietarios de motos y la duración de las llantas. La población
es demasiado pequeña para ser aproximada por una distribución normal. Se
tomarán todas las muestras posibles en grupos de tres, se calcularán las medias de
muestra (x̄), se enumerará y se calculará la media de la distribución de muestreo
(ux̄)
Ejemplo:
Propietario C D E F G
Duración llanta (meses) 3 3 7 9 14
Total 36 meses.
Media = 36/5 = 7.2 meses.
cde cdf cdg cef ceg cfg def deg dfg efg.
1. El peso medio de los alumnos de una clase es 58,2 kg y su desviación típica
3,1 kg. El de las
alumnas de esa clase es 52,4 kg y su desviación típica es 5,1 kg. Calcula el
coeficiente de variación
y compara la dispersión de ambos grupos.
Solución:
C.V. (Hombres) = 2,58
1,3 · 100 = 5,33%
C.V. (mujeres ) = 4,52
1,5 · 100 = 9,73% Hay mayor dispersión en el peso de las mujeres.
2.
En una universidad existen dos salones de estadística, el A y el B. Ambos salones
hicieron el examen final del curso y luego de dos semanas el profesor entregó las
notas y se percató de algo bien raro. En los salones, que están compuestos por 10
alumnos cada uno habían las siguientes notas:
Salón A: (06, 08, 08, 08, 09, 09, 10, 11, 12, 15). En este caso, el promedio del salón
A es de 9.6 sobre 20, lo cual es bien bajo.
En cambio en el salón B, las notas fueron todo lo contrario: (10, 13, 14, 15, 16, 17,
17, 18, 19, 19). En este caso, el promedio del salón B es de 15.8, lo cual es bien
alto.
Como los puntajes de una distribución siempre van de izquierda a derecha y de
menos a más entonces, como en el salón A hay muchos puntajes bajos (06, 08, etc)
el pico de la curva está al lado izquierdo. En cambio, en el salón B hay muchos
puntajes altos (17, 18, 19), entonces el pico de la curva va hacia el lado derecho.
El teorema del límite central:
Asegura que la distribución de muestreo de la media se aproxima a la normal
al incrementarse el tamaño de la muestra. Una muestra no tiene que ser muy
grande para que la distribución de muestreo de la media se acerque a la
normal.
La importancia del teorema del límite central es que permite utilizar
estadísticas de muestra para hacer inferencias con respecto a los parámetros
de población, sin saber sobre la forma de la distribución de frecuencia de esa
población más que lo que se pueda obtener de la muestra.
Uso del teorema del límite central:
La distribución de los ingresos anuales de los estudiantes de Trabajo Social
del décimo semestre esta sesgada de manera negativa. Esta distribución
tiene una media de Q. 19000.00 y una desviación estándar de Q. 2000.00. Si
se extrae una muestra de 30 estudiantes de Ts. ¿Cuál es la probabilidad de
que sus ganancias promedien más de Q. 19750.00 anualmente? Calcular el
error estándar de la población
Ejemplo:
σx̄ = σ → σx̄ = 2000 σx̄ = 2000
√n √30 5.477
σx̄ = Q. 365.16 el error estándar de la media.
Para determinar la probabilidad de que las
ganancias sean mayores a Q. 19750.00 se utiliza.
z = x̄ – u = 19750 – 19000 = 750 =
σx̄ 365.16 365.16
2.05 Desv. Est. De la media de una dist. De prob.
Ejemplo:
El área es de 0.4798 para un valor de z de 2.05
0.5000 (área entre la media y la cola derecha)
- 0.4798 (área entre la media y Q. 19750)
0.0202 (área entre la cola derecha y Q. 19750)
Por tanto, se ha determinado que hay ligeramente más del 2% de
probabilidad de que los ingresos promedio sean mayores que Q. 19750
anualmente en un grupo de 30 estudiantes de
1. En una asignatura del colegio la probabilidad de que te saquen a la pizarra en
cada clase es del 10%. A lo largo del año tienes 100 clases de esa
asignatura. ¿Cuál es la probabilidad de tener que salir a la pizarra más de 15
veces?
Se vuelve a aplicar el Teorema Central del Límite.
Salir a la pizarra es una variable independiente que sigue el modelo de distribución
de Bernouilli:
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independientes es:
m = 0,10
s 2 = 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye según una normal cuya media
y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el
valor equivalente de la variable normal tipificada:
Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo
del curso es tan sólo del 4,75%
2. La renta media de los habitantes de un país se distribuye uniformemente
entre 4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que
al seleccionar al azar a 100 personas la suma de sus rentas supere los 725
millones ptas.
Cada renta personal es una variable independiente que se distribuye según
una función uniforme. Por ello, a la suma de las rentas de 100 personas se le
puede aplicar el Teorema Central del Límite.
La media y varianza de cada variable individual es:
Varianza: n * s2 = 100 * 3 = 300
Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable
normal tipificada:
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas
seleccionadas al azar supere los 725 millones de pesetas es tan sólo del
7,49%
LA PRUEBA DE HIPÓTESIS:
Comienza con una suposición, llamada hipótesis, que se hace acerca de un
parámetro de una población, después se recolectan datos de una muestra, se
producen estadísticas muéstrales y se utiliza esa información para decidir
qué tan probable es que el parámetro de la población hipotético sea correcto.
Si la diferencia obtenida es significativa o no. Mientras más pequeña sea la
diferencia, mayor será la probabilidad de que el valor hipotético para la media
sea correcto. Mientras mayor sea la diferencia, más pequeña será la
probabilidad. No se puede aceptar o rechazar una hipótesis sobre un
parámetro de población, sólo por intuición. Más bien, se necesita aprender
cómo decidir objetivamente si se acepta o se rechaza una corazonada, con
base a la información de la muestra.
1). ¿Por qué es necesario contemplar la incertidumbre en la toma de
decisiones, incluso cuando se usan técnicas estadísticas?
2). Teóricamente, ¿cómo probaría la hipótesis de que una moneda no está
alterada?
3). ¿Es posible que se acepte una hipótesis falsa? ¿Cómo explicaría esto?
4). ¿Cómo explicaría que se tuviera una gran diferencia entre un parámetro
de población hipotético y un estadístico si, en efecto, la hipótesis es cierta?
Ejemplo 1. A la licenciada de Trabajo Social del IGSS, la junta directiva de
dicha institución le solicita, que aporte su experiencia, para tomar la decisión
adecuada, de aceptar o rechazar el contrato, para techar el hospital regional
del IGGS de Quetzaltenango, las especificaciones de construcción indican un
techo aproximadamente 10000 láminas de aluminio con un grosor de 0.04
pulgadas. Las láminas de aluminio no pueden ser considerablemente más
gruesas que 0.04 pulgadas.
Porque la estructura no podría soportar el peso adicional y tampoco pueden
ser más delgadas porque la fuerza estructural el techo seria inadecuada.
Debido a estas restricciones en el grosor, los personeros del IGSS, deben
revisar cuidadosamente las láminas de aluminio de su proveedor. Es clar que
el IGSS no desea medir cada lamina, así que sugieren tomar una muestra
aleatoria de 100.
Las láminas de la muestra tienen un grosor
medio de 0.0408 pulgadas, las láminas tienen una desviación estándar de
0.004 pulgadas de grosor. Con base a esos datos la junta directiva del IGSS,
debe decidir si las 10000 láminas cumplen con las especificaciones, para que
se acepte o se rechace el cargamento de láminas por cumplir o no con las
especificaciones arquitectónicas requeridas.
x = Valor de la variable aleatoria.
𝜇 = Media proporcional de la distribución de la variable
aleatoria.
σ = Desviación Estándar poblacional de la distribución.
z = Numero de desviaciones estándar que hay desde x a
la media de la distribución.
x̄ = Media muestral de la distribución.
S = Desviación estándar muestral de la probabilidad.
σx̄ = Error estándar de la media.
LA PRUEBA DE HIPÓTESIS:
σx̄ = σ σx̄ = 0.004 pulg.
√n 100
σx̄ = 0.004 pulg. σx̄ = 0.0004 pulg.
10
z = x̄ – 𝜇 z = 0.0408 - 0.04 z = 2 σx
σx̄ 0.0004
INTERPRETACIÓN DE LA PROBABILIDAD:
4.5% es la prob. total de que la media muestral difiera de la media de la población
en dos o más errores estándar, esto es, la probabilidad de que la media de la
muestra sea 0.0408 pulgadas o mayor, o 0.0392 pulgadas o menor es sólo 4.5%
[P(z ≥ 2 o z ≤ -2) = 0.0456 o alrededor de 4.5%]. Con esta posibilidad tan baja, se
puede concluir que no es probable que una población con una media real de 0.04
pulgadas produzca una muestra como esta. La Trabajadora
Social rechazara la afirmación de la compañía de aluminio respecto al grosor
medidas de las láminas.
EL PAPEL DEL TOMADOR DE DECISIONES:
En la formulación de hipótesis: La diferencia entre la media de la muestra y la media
hipotética de la población es demasiado grande y la probabilidad de
que la población produzca una muestra aleatoria semejante es demasiada baja. Por
qué la probabilidad de 4.5% es demasiado baja o errónea, es un juicio que debe
hacer el tomador de decisiones. El tomador de decisiones debe estar muy seguro,
respecto a las características de los elementos que se están probando y en ese
caso incluso 2% es muy alto para ser atribuible al azar.
EL PAPEL DEL TOMADOR DE DECISIONES:
En cada situación, es necesario determinar los costos resultantes de tomar una
decisión incorrecta y el nivel preciso de riesgo que se está dispuesto a correr.
Se corre el riesgo de rechazar una hipótesis que es cierta. En esta o cualquier otra
toma de decisiones, no puede haber transacciones libres de riesgo
LA PRUEBA DE HIPÓTESIS:
Tipos de Errores: Al realizar una prueba de hipótesis se pueden cometer errores.
Al rechazo de la hipótesis nula, cuando esta es verdadera, se le conoce como error
tipo I. y a la probabilidad de cometer este primer tipo de
error se le denota por la letra 𝛼. En cambio, al no rechazo de la hipótesis nula,
cuando ésta es falsa recibe el nombre de error tipo II. y a la probabilidad de cometer
este segundo tipo de error se le denota por la letra 𝛽.
Se debe establecer el valor supuesto o hipotético del parámetro de la población
antes de comenzar a tomar la muestra. A esta suposición se le conoce como
hipótesis nula.
𝐻0: 𝜇 = 200
𝐻1: 𝜇 ≠ 200
𝐻1: 𝜇 > 200
𝐻1: 𝜇 < 200
Interpretación del nivel de significancia: El propósito de la prueba de hipótesis no es
cuestionar el valor calculado del estadístico de la muestra, sino hacer un juicio
respecto a la diferencia entre ese estadístico y un parámetro hipotético de la
población. Consiste en decidir qué criterio utilizar para confirmar si se acepta o se
rechaza la hipótesis nula. En términos estadísticos, el valor 0.045 se conoce como
nivel de significancia.
Ejemplo 2: Se supone que una empresa embotelladora de bebidas gaseosas de
Quetzaltenango, de que la media poblacional es de 16 onzas y seleccionan un nivel
de significancia del 5%. Debido al planteamiento del problema el conjunto de
hipótesis queda como sigue: 𝐻0: 𝜇 = 16 𝐻1: 𝜇 ≠ 16 Si la empresa embotelladora
toma una muestra de 𝑛 = 50 botellas con una media de ̅ x = 16.357 onzas y una
desviación estándar de 𝑠 = 0.866 onzas, tenemos que:
𝑍 = 16.357 − 16 = 2.91
0.866/√50
Ahora comparando 𝑍 con los valores críticos de 𝑧 de la tabla que son ±1.96. La regla
de decisión sería:
No se rechaza la hipótesis nula sí −1.96 ≤ 𝑍 ≤ 1.96.
Se rechaza si 𝑍 < −1.96 o 𝑍 > 1.96. Luego como 𝑍
= 2.91 > 1.96 se rechaza la hipótesis nula a un nivel de significancia del 5% en favor
de la hipótesis alternativa.
Pruebas de Una Cola para μ en contraste con el anterior caso, en este solo se está
interesado en una de las dos colas de la distribución.
Ejemplo 3: En una reunión informativa para una oficina corporativa, el gerente del
IGSS Xela, reporto que el número promedio de camas ocupadas por día es de por
lo menos 212. Uno de los funcionarios de la junta directiva cree, que esta cifra
puede estar sobre estimada.
Una muestra de 150 días produce una media de 201.3 camas ocupadas y una
desviación estándar de 45.5 camas. Si estos resultados sugieren que el gerente ha
inflado su reporte, será amonestado severamente. A un nivel del 1% ¿Cuál es el
destino del gerente?
La afirmación del gerente de que 𝜇 ≥ 212 lleva el signo igual y por tanto se toma la
siguiente hipótesis nula 𝐻0: 𝜇 ≥ 212 vs 𝐻1: 𝜇 < 212 Luego
Z= 201.3 − 212 = −2.88 , 45.5/√150.
La regla de decisión es: No rechazar 𝐻0 sí 𝑍 ≥ −2.33. Rechazar sí 𝑍 < −2.33.
Entonces el valor 𝑍 = −2.88 claramente está en la zona de rechazo lo que indica que
el gerente podría estar en serios problemas.
1. Jane acaba de incorporarse al equipo de ventas de una compañía muy
competitiva. En una muestra de 16 llamadas de ventas se comprobó
que cerró el contrato por un valor promedio de 108 dólares con una
desviación típica de 12 dólares. Pruebe al 5 % de significación que la
media de la población es de al menos 100 dólares contra la alternativa
de que es menor de 100 dólares. La política de la compañía exige que
los nuevos integrantes del equipo de ventas superen un promedio de
100 dólares por contrato durante el periodo de prueba del empleo.
¿Podemos concluir que Jane ha cumplido este requisito con un nivel
de significación del 95 %?
Solución 1
1. H0: µ ≤ 100
Ha: µ > 100
Las hipótesis nula y alternativa son para el parámetro µ porque el número de
dólares de los contratos es una variable aleatoria continua. Además, se trata
de una prueba de una cola porque a la compañía solo le interesa si el número
de dólares por contacto está por debajo de una cifra determinada, no de una
cifra "demasiado alta". Esto se considera una afirmación de que el requisito
se cumple; por ende, está en la hipótesis alternativa.
2. Estadístico de prueba:
Valor crítico:𝑡 𝑎 =1,753 con n-1 grados de libertad = 15
El estadístico de prueba es una t de Student porque el tamaño de la muestra
es inferior a 30; por ende, no podemos utilizar la distribución normal. Al
comparar el valor calculado del estadístico de prueba y el valor crítico de
𝑡(𝑡 𝑎) a un nivel de significación del 5 %, vemos que el valor calculado está en
la cola de la distribución. Así, concluimos que 108 dólares por contrato es
significativamente mayor que el valor hipotético de 100; por ende, no
podemos aceptar la hipótesis nula. Hay pruebas que apoyan que el
desempeño de Jane cumple con los estándares de la compañía.
Figura 9.8
2. Una empresa está interesada en lanzar un nuevo producto al mercado. Tras
realizar una campaña publicitaria, se toma la muestra de 1 000 habitantes, de los
cuales, 25 no conocían el producto. A un nivel de significación del 1% ¿apoya el
estudio las siguientes hipótesis?
a. Más del 3% de la población no
conoce el nuevo producto.
b. Menos del 2% de la población no
conoce el nuevo producto
Datos:
n = 1000
x = 25
Donde:
x = ocurrencias
n = observaciones
proporción de la muestra
proporción propuesta
Solución:
a)
a = 0,01
H0 es aceptada, ya que zprueba (-0,93) es menor que
ztabla (2,326), por lo que no es cierto que más del 3% de
la población no conoce el nuevo producto.