Paso 3 Actividad sobre prueba de hipótesis
Por:
Tania Marcela Diaz Rodríguez. Código:
Diosmel Junior Angarita Cervantes. Código:
Daniel Antonio Sánchez. Código: 78078323
Elver Ariel Vega. Código:
Jeferson Andres Ortiz Ordoñez Cód. 1083907672
Grupo: 551112_7
Curso:
Inferencia Estadística
Presentado a:
Víctor Manuel Mendoza
Universidad Nacional Abierta Y A Distancia UNAD
Escuela Ciencias De La Educación
Licenciatura En Matemáticas
30 de noviembre de 2020
Introducción
El presente documento, realiza un estudio de elementos estadísticos importantes como
son los métodos paramétricos y no paramétricos, los cuales son de gran uso a la hora de hacer un
análisis sobre una muestra y tener que destacar diferentes particularidades de dicha situación.
Estos procedimientos, demuestran hipótesis, manifiestan estadísticamente datos que sirven de
base para entender la muestra analizada.
Ahora bien, estos métodos, presentan diferenciaciones que los individualizan y por ende,
crean ventajas y desventajas del uno sobre el otro, lo cual ayuda al investigador para poder
seleccionar el más pertinente según el problema, objeto de estudio.
Por esta razón, también se hará referencia sobre las bondades o fortalezas de cada método
y así poder visualizar si la parametría es mejor que la no parametría o viceversa.
.
Parte A
1. Realizar un análisis sobre los métodos de inferencia paramétricos y no paramétricos
identificando sus ventajas y desventajas en términos de la información muestral.
MÉTODOS PARAMÉTRICOS Y NO PARAMÉTRICOS
Los métodos paramétricos, hacen parte de la estadística, y según los datos conceptuales
se basan en el conocimiento de las distribuciones muestrales, así como la diferenciación de
promedios o porcentajes, sobre todo cuando las muestras provienen de una misma población. De
manera general, esos métodos se estiman los parámetros de las poblaciones de origen.
Ahora bien, cuando por el escaso número de observaciones, o por el nivel de medición de
las variables, no es correcto o no es posible hacer supuestos sobre las distribuciones muestrales
subyacentes, en tales casos se usan los métodos no paramétricos o de distribución libre.
De esta manera, cada uno de estos métodos presenta particularidades distintas,
estableciendo ventajas el uno sobre el otro. Por ejemplo, los métodos paramétricos, se aplican en
muestras de gran tamaño, mientras que los no paramétricos se usan en muestras pequeñas. Los
paramétricos, se usan en variables de tipo normal o intervalo, mientras que los no paramétricos
sólo se permiten en variables categóricas.
Así mismo, los paramétricos parten de una distribución normal, por el contrario, los no
paramétricos se desconoce la distribución de los datos. De igual manera, el paramétricos, no
considera valores perdidos como fuente de información, mientras que el no paramétrico asume
los valores perdidos como fuente de información.
Todo esto, nos deja ver que el paramétrico ofrece muchas ventajas, pues se utiliza con
muestras grande y trata de ser muy formal y racional. No obstante, desconoce algunos elementos
que se pueden usar a la hora de analizar una muestra, pues no siempre se cuenta con todos los
datos claramente, y es ahí, donde los métodos no paramétricos, cumplen una función importante
y ofrecen una gran ventaja, debido a que ellos trabajan con estas particularidades.
Si el tamaño de la muestra es muy pequeño, puede no haber otra opci6n que usar
una prueba estadística no paramétrica, a menos que la naturaleza de la distribución de la
población se conozca con exactitud.
VENTAJAS DE LOS MÉTODOS PARAMETRICOS
Más poder de eficiencia.
Más sensibles a los rasgos de los datos recolectados.
Menos posibilidad de errores.
Robustas (dan estimaciones probabilísticas bastante exactas).
DESVENTAJAS DE LOS MÉTODOS PARAMETRICOS
· Más complicadas de calcular.
· Limitaciones en los tipos de datos que se pueden evaluar.
VENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS
· Más poder de eficiencia.
· Más sensibles a los rasgos de los datos recolectados.
· Menos posibilidad de errores.
· Robustas (dan estimaciones probabilísticas bastante exactas).
DESVENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS
· No son sistemáticas.
· Se les relaciona con la conveniencia, esto se debe a que no se tiene una distribución
fija para este tipo de estadística por lo que en ocasiones puede ser un problema el elegir la
adecuada.
· Las tablas necesarias para aplicar las pruebas no paramétricas están muy difundidas y
aparecen en diferentes formatos, lo que podría ocasionar alguna confusión en el investigador ó la
persona que esté aplicando alguna prueba no Paramétrica.
2. Consultar la definición, propiedades, cuando o para qué se utiliza de las
siguientes palabras:
Prueba estadística, hipótesis y parámetros poblacionales.
Prueba estadística
Una prueba estadística es una forma de evaluar la evidencia que los datos proporcionan
para probar una hipótesis. Esta hipótesis se denomina hipótesis nula, y suele denominarse H0.
Bajo H0, los datos se generan mediante procesos aleatorios. En otras palabras, los procesos
controlados (las manipulaciones experimentales, por ejemplo) no afectan a los datos.
Normalmente, H0 establece la igualdad (entre las medias, o entre las varianzas, o entre un
coeficiente de correlación y cero,
Prueba de hipótesis
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una
afirmación acerca de una población dependiendo de la evidencia proporcionada por una muestra
de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis
nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo general, la
hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis
alternativa es el enunciado que se desea poder concluir que es verdadero de acuerdo con la
evidencia proporcionada por los datos de la muestra.
Características
Siempre es sobre parámetros (características poblacionales).
El juego de hipótesis es de dos, la H 0, llamada "nula" y la H a, o "alternativa".
El investigador solamente puede fijar la probabilidad del Error Tipo I.
Supone temporalmente que la H 0 es cierta.
La decisión se basa en los estimadores de los parámetros que se calculan con la
información muestral.
Elementos de una prueba estadística
1. Hipótesis nula, H 0
2. Hipótesis alternativa, H a
3. Estadístico de prueba
4. Región de rechazo
Parámetros poblacionales
Para aproximarnos a estos conceptos, podríamos considerar que los valores de las
características de la población diana se denominan parámetros. La tensión arterial sistólica, la
glucemia basal, el índice de masa corporal, etc., en la población son características de esa
población que pueden cuantificarse a través de parámetros poblacionales (por ejemplo, media de
la tensión arterial sistólica).
Estos valores poblacionales son habitualmente desconocidos y su cuantificación no es
abordable al requerir el estudio de poblaciones amplias.
Cuando en una muestra de individuos de la población diana medimos el valor de estas
características, podemos comunicarlo como un estimador (por ejemplo, media de tensión arterial
sistólica en la muestra).
La inferencia estadística nos permite aproximarnos al verdadero valor del parámetro
poblacional (característica en la población) a partir del valor del estimador muestral
(característica en la muestra).
Total, poblacional de una característica X.
Se define como la suma del valor de dicha característica en todos los elementos de la
población; se representa como X de forma que podemos expresarlo:
Hipótesis de investigación, hipótesis alternativa, hipótesis nula, ¿Cómo usamos esos
datos para decidir entre la hipótesis nula y la hipótesis alternativa?
Hipótesis de investigación:
Es una afirmación o conjetura acerca de un parámetro de una o más poblaciones y que
está sujeta a verificación.
Prueba de hipótesis:
Procedimiento basado en evidencia de la muestra y de la teoría de probabilidades para
determinar si la hipótesis es una afirmación razonable.
Hipótesis nula:
Es cualquier hipótesis que se desea probar, se denota como H0
Hipótesis alternativa:
Es la hipótesis que se acepta cuando la hipótesis nula es rechazada, se denota como H1.
¿Cómo usamos esos datos para decidir entre la hipótesis nula y la hipótesis
alternativa?
Al momento de tener una evidencia suficiente para aceptar o rechazar ya sea la hipótesis
nula o alternativa, debemos tener en cuenta un desarrollo de pasos:
1. Se establece la hipótesis nula y la hipótesis alternativa
2. Se selecciona un nivel de significancia para la prueba
3. Se identifica el estadístico de prueba
4. Se formula una regla para tomar decisiones
5. Se toma una muestra y se llega a una decisión: se acepta o se rechaza la
hipótesis nula.
De igual forma tener presente otras definiciones importantes para el desarrollo de la
actividad propuesta como lo son:
Nivel de significancia:
Es la probabilidad de rechazar la hipótesis nula cuando es verdadera y se denota por α
Error tipo I:
Se comete cuando se rechaza una hipótesis que es correcta y se denota por α
Error tipo II:
Se comete cuando se acepta una hipótesis que es incorrecta y se denota por β
Decisiones con respecto a H0
Se acepta Se rechaza
Hipótesis Nula (H0)
Verdader Decisión Error
a correcta Tipo I
Error Decisión
Falsa
Tipo II correcta
Tabla 1: Error tipo I y Error tipo II
Estadístico de prueba
Un estadístico de prueba es una variable aleatoria que se calcula a partir de datos de
muestra y se utiliza en una prueba de hipótesis. Puede utilizar los estadísticos de prueba para
determinar si puede rechazar la hipótesis nula. El estadístico de prueba compara sus datos con lo
que se espera bajo la hipótesis nula. El estadístico de prueba se utiliza para calcular el valor p.
Un estadístico de prueba mide el grado de concordancia entre una muestra de datos y la
hipótesis nula. Su valor observado cambia aleatoriamente de una muestra aleatoria a una muestra
diferente. Un estadístico de prueba contiene información acerca de los datos que es relevante
para decidir si se puede rechazar la hipótesis nula. La distribución del muestreo del estadístico de
prueba bajo la hipótesis nula se denomina distribución nula. Cuando los datos muestran
evidencia clara en contra de los supuestos de la hipótesis nula, la magnitud del estadístico de
prueba se vuelve demasiado grande o demasiado pequeña dependiendo de la hipótesis
alternativa. Esto hace que el valor p de la prueba se vuelva lo suficientemente pequeño como
para rechazar la hipótesis nula.
Nivel de prueba
Nivel de prueba es el grupo de actividades que están organizadas y gestionadas de forma
conjunta. Un nivel de prueba está vinculado con las responsabilidades en un proyecto. Ejemplos
de niveles de pruebas son las pruebas de componente, pruebas de integración, pruebas de sistema
y pruebas de aceptación.
Bondad de una prueba
Las pruebas de bondad de ajuste son pruebas de hipótesis para verificar si los datos
observados en una muestra aleatoria se ajustan con algún nivel de significancia a determinada
distribución de probabilidad (uniforme, exponencial, normal, poisson, u otra cualquiera).
Parte B
Realizar los siguientes ejercicios presentando el paso a paso del desarrollo y justificar los
resultados.
1. Se sabe que la proporción de artículos defectuosos en un proceso de
manufactura es de 0.15. El proceso de vigila en forma periódica tomando muestras
aleatorias de tamaño 20 e inspeccionando las unidades. Si se encuentran dos o más
unidades defectuosas en la muestra, el proceso se detiene y se considera como “fuera de
control”.
a. Enunciar las hipótesis nula y alternativa apropiadas.
b. Obtener la probabilidad del error tipo I.
c. Obtener y graficas la función de potencia para los
siguientes valores aleatorios de la proporción de artículos defectuosos:
0,06, 0.08, 0.1, 0.15, 0.2 y 0.25
En esta afirmación se debe determinar
En las pruebas de hipótesis se debe comprobar, con base en los resultados obtenidos en
una muestra, si el valor verdadero de una proporción es igual a una constante determinada.
En el caso de una sola proporción (P) las hipótesis son
Hipótesis nula:
H0 = P = p0
donde p0 es la constante determinada
Hipótesis alternativa: Se tienen las tres siguientes posibilidades
H1 = P > p0
Donde:
n=2
P=0.15 Q=0.85
0
Solución a:
H0: p=0,15
H1: p>0.15
Solución b:
Error tipo I
α = P (rechazar h0 / H0 es correcta)
20
∝=∑ 20 ( 0,15 ) ( 0,85 )
x 20−x
2 x ( )
Al realizar el cálculo, el resultado es
∝=0,824
Solución c:
Para p = 0,06
20
∝=∑ 20 ( 0,06 ) ( 0,94 )
x 20−x
2 x ( )
Al realizar el cálculo, el resultado es
∝=0,3395
Para p = 0,08
20
∝=∑ 20 ( 0,08 ) ( 0,92 )
x 20− x
2 x ( )
Al realizar el cálculo, el resultado es
∝=0,4831
Para p = 0,1
20
∝=∑ 20 ( 0,1 ) ( 0,9 )
x 20− x
2 x ( )
Al realizar el cálculo, el resultado es
∝=0,6083
Para p = 0,2
20
∝=∑ 20 ( 0,2 ) ( 0,8 )
x 20− x
2 x ( )
Al realizar el cálculo, el resultado es
∝=0,9308
Para p = 0,25
20
∝=∑ 20 ( 0,25 ) ( 0,75 )
x 20−x
2 x ( )
Al realizar el cálculo, el resultado es
∝=0,9757
Imagen. Gráfica la función potencia para los valores del literal c
2. Una muestra aleatoria de 100 muertes registradas en Estados Unidos
durante el año pasado mostro una vida promedio de 71.8 años. Suponiendo una
desviación estándar poblacional de 8.9 años y un nivel de significancia de 0.05. ¿Es
apropiado indicar que la vida promedio hoy en día es mayor que 70 años? Justifique
su respuesta.
Rpta.
El promedio es mayor de 70
Sea
μ=vida promedio
σ =desviación estándar
α =nivel de significancia
μ=71,8; σ=8,9 ; α =0,05 ; n=100
H 0 :μ=70
H 1 : μ> 70
71,8−70 1,8
z= =
8,9 0,89
√100
z=2,022
z 1−0,05=z 0,95=1,64
z > z 1−¿ α ; rechazar H 0 ¿
El promedio es mayor de 70
3. Para justificar su petición de aumento de salario, los empleados del Depto. de
despachos de una firma de ventas por correo, sostienen que en promedio el Depto.
completa una orden en 13 min. Si Ud. es el gerente general de firma, Que conclusión
obtiene si en una muestra de 400 órdenes, da un tiempo medio de terminación del pedido
de 14 min, con una desviación estándar de 10 min y un nivel de significancia del 0.05.
Rpta.
Sea
μ=13 min; H 1 ::μ >13 min
n=400
x́=14 min
s=10 min
14−13 1
z= = =2
10 10
√ 400 20
z 1−¿α =z 0,95=1,64 ¿
z > z 1−¿ α ; rechazar H 0 ¿
El tiempo es mayor que 13
Ejercicio 4
La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que
es de 20 onzas. En forma periódica, se escogen al azar 25 recipientes y el contenido de cada uno de
éstos se pesa. Se juzga al proceso como fuera de control cuando la media muestral 𝑋̅ es menor o igual
a 19.8 o mayor o igual a 20.2 onzas. Se supone que la cantidad que se vacía en cada recipiente se
encuentra aproximada, en forma adecuada, por una distribución normal con una desviación estándar
de 0.5 onzas. a. Enunciar las hipótesis nula y alternativa que son propias para esta situación. b.
Obtener la probabilidad del error de tipo I. c. Obtener y graficas la función de potencia para los
siguientes valores medios de llenado: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4 y 20.5.
Respuesta:
Ejercicio 5
La media de llenado de las cajas de un cereal determinado en una empresa de
empacados es de 368 gr. El proceso es tan rápido que en algunas cajas hay excesos y en otras
hay faltante. Supóngase que en una muestra de 25 cajas la desviación estándar de la
población es de 15 gr. Y la media muestral es de 372.5 gr. Se rechaza o se acepta la prueba de
hipótesis nula, teniendo en cuenta un nivel de significancia del 5%. Es equivalente al
Intervalo de confianza del 95%.
Respuesta:
Es aprobada la prueba de Hipótesis Nula
Procedimientos:
Para el desarrollo de este ejercicio se presenta de la siguiente manera
Tenemos de hipótesis nula H 0=μ :368 gr
5%
Los datos del nivel de significancia 5% = 0,05 colas: =2,5 %=0,025
2
Estadístico de prueba X : 372,5 n = 25 σ =15
La desviación estándar
σ 15
σ x= = =3 gr
√ n 25
Para A = 0,025 El valor de las unidades es Z = −¿ + ¿¿
¿ 1,96
Intervalo critico -1,96 ¿ Z ¿ +1,96
Se procede a calcular los limites
Z1 = -1,96 x cR =μ −¿
+ ¿¿
¿ zσx
x 1cR=¿ 368 – (1,96) (3)
x 1cR=¿ 362,2
Y para
Z2 = 1,96 x 2cR =¿ 368 + (1,96) (3)
x 2cR =¿ 373,88
Y en la media los valores críticos en intervalo
362,12 ≤ μ ≤373,88
Dado que si tenemos que la media muestral es de 372,5 entonces verifiquemos si acepta o
no acepta
X−μ 372,5−368
Z= = reemplazamos =+1,5
σx 3
Por lo cual los resultados obtenidos no se rechazan siendo
Z = 1,5 ¿ 1,96
H 0=μ :368 gr
Conclusión
El trabajo realizado anteriormente, cuya temática giró en torno a los métodos
paramétricos y no paramétricos, fue de gran valor y trascendencia, en la medida que se pudo
conocer más del tema en cuestión, destacando sus características, ventajas y desventajas, lo cual
facilitó una mayor comprensión conceptual del tema.
De la misma forma, la indagación de los interrogantes planteados, asi como la
información conocida del tema, fortaleció el aprendizaje grupal e individual, facilitando asi un
proceso enriquecedor tanto de teoría como de práctica, en el que todos aprendimos de manera
recíproca.
Finalmente, hay que decir que fue un trabajo cargado de muchas enseñanzas, tanto en el
campo teórico como personal, pues la estadística, es un eje de investigación sumamente
importante en el mundo matemático, y que normalmente se puede usar en la cotidianidad.
Además, la estrategia de trabajo en equipo promueve la tolerancia, el respeto, etc.
Referencias bibliográficas
Abreu, J. (2012). Hipótesis, método & diseño de investigación (hypothesis, method & research
design). Daena: International Journal of Good Conscience, 7(2), 187-197. Recuperado de
http://www.spentamexico.org/v7-n2/7(2)187-197.pdf
Ostle, B. (1981). Estadística aplicada. Limusa. Recuperado de
http://dspace.ucbscz.edu.bo/dspace/bitstream/123456789/4390/1/678.pdf
Wackerly, D., Mendenhall, W., & Scheaffer, R. (2009). Wackerly, D.D. and Mendenhall, W. and
Scheaffer, R.L. Estadística Matemática Con Aplicaciones, Séptima Edición, Cengage
Learning. Recuperado de https://docs.google.com/viewer?
a=v&pid=sites&srcid=Y2llbmNpYXMudW5hbS5teHxtLWVzdGFkaXN0aWNhMXkyf
Gd4OjQyZDI5ZDE1ZjE2MjhhNzg
Maestro Gustavo. (7 de marzo de 2016). Prueba de hipótesis. [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=tCLeJCuBSZM
Gabriel Leandro. (31 de agosto de 2017). Estadística prueba de hipótesis. [Archivo de video].
Recuperado de https://www.youtube.com/watch?v=5ZvKgnRVSjI&t=637s
Wackerly, D.D. and Mendenhall, W. and Scheaffer, R.L. (2009), Estadística Matemática Con
Aplicaciones, Séptima Edición, Cengage Learning. Recuperado de
https://www.cimat.mx/ciencia_para_jovenes/bachillerato/libros/[Wackerly,Mendenhall,S
cheaffer]Estadistica_Matematica_con_Aplicaciones.pdf
Nivel de prueba, recuperado de:https://www.globetesting.com/nivel-de-prueba/#:~:text=Nivel
%20de%20prueba%20es%20el,sistema%20y%20pruebas%20de%20aceptaci%C3%B3n.
Estadístico de prueba, recuperado de: https://support.minitab.com/es-mx/minitab/18/help-and-
how-to/statistics/basic-statistics/supporting-topics/basics/what-is-a-test-
statistic/#:~:text=Un%20estad%C3%ADstico%20de%20prueba%20es,espera%20bajo
%20la%20hip%C3%B3tesis%20nula.
Bondad de una prueba recuperado de: http://dcb.fi-
c.unam.mx/profesores/irene/Notas/PruebaBondad.pdf