INSTITUTO TECNOLOGICO SUPERIOR ACAYUCAN
DOCENTE: RAMON CANSECO ENRIQUEZ
MATERIA: ESTADISTICA INFERENCIAL 1
“TRABAJO DE INVESTIGACION”
ALUMNA: ESBEIDY CLARA MORGADO
GRUPO: 405_ E
AULA: D_10
SEMESTRE: CUARTO
INTRODUCCION
Dentro del estudio de la inferencia estadística, se describe cómo se puede tomar
una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro
poblacional en la cual se puede emplear el método de muestreo y el teorema del
valor central lo que permite explicar cómo a partir de una muestra se puede inferir
algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución
de muestreo de medias muéstrales que nos permite explicar el teorema del límite
central y utilizar este teorema para encontrar las probabilidades de obtener las
distintas medias maestrales de una población.
Pero es necesario tener conocimiento de ciertos datos de la población como la
media, la desviación estándar o la forma de la población, pero a veces no se
dispone de esta información.
En este caso es necesario hacer una estimación puntual que es un valor que se usa
para estimar un valor poblacional. Pero una estimación puntual es un solo valor y se
requiere un intervalo de valores a esto se denomina intervalo te confianza y se
espera que dentro de este intervalo se encuentre el parámetro poblacional buscado.
También se utiliza una estimación mediante un intervalo, el cual es un rango de
valores en el que se espera se encuentre el parámetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una
aseveración acerca de un parámetro poblacional este método es denominado
Prueba de hipótesis para una muestra.
INDICE
Metodología para la prueba de hipótesis………………………….. 4
Hipótesis nula y alternativa…………………………………………… 6
Error tipo 1 y tipo 2……………………………………………………….. 8
Prueba de hipótesis z para la media (desviación estándar población
conocida)………………………………………………………………………….. 10
Prueba para proporciones…………………………………………………. 12
Selección del tamaño de muestra (para estimar la media
poblacional)…………………………………………………………………… 13
Selección del tamaño de muestra (para estimar la proporción
poblacional)………………………………………………………………….. 14
Conclusión……………………………………………………………. 15
Bibliografía………………………………………………………………………16
METODOLOGIA PARA LA PRUEBA DE HIPOTESIS
La hipótesis de investigación que se genera en todo proyecto se define como la
proposición o explicación tentativa del fenómeno investigado o la postulación de lo
que se busca o se trata de probar. La hipótesis de trabajo está integrada por
enunciados formales que declaran lo que el investigador quiere probar. De tal manera
que, para refutar o confirmar un problema de investigación, se debe plantear una
hipótesis que intenta proponer o explicar la relación entre dos variables, y ésta se
debe apoyar siempre en conocimientos organizados y sistematizados.
El diseño de una investigación clínica debe tomar en cuenta si el estudio pretende
generar una hipótesis para ser probada en estudios futuros o probar hipótesis
específicas sobre las que el investigador tiene cierta evidencia de que sus
observaciones puedan ser ciertas. Los estudios que generan hipótesis se conocen
como exploratorios; los que prueban diferentes hipótesis se conocen como
confirmatorios. Por supuesto que un solo estudio puede tener aspectos exploratorios
y confirmatorios.
JUSTIFICACION DE HIPOTESIS
La prueba de hipótesis es un método esencial para la toma de decisiones. La
decisión relaciona la elección entre dos enunciados competitivos y mutuamente
excluyentes, respecto de uno o más parámetros de la población. Los enunciados
competitivos se conocen como hipótesis nula y alternativa, respectivamente.
Con base a lo anterior, es necesario señalar los atributos principales que debe poseer
una hipótesis:
1. Debe hacer referencia a una situación real.
2. Las variables que se presentan en su planteamiento deben ser precisas,
comprensibles y concretas.
3. La relación entre las variables debe ser clara, verosímil y lógica.
4. Los términos y las relaciones planteadas deben ser observables y medibles.
5. Las variables deben estar relacionadas con técnicas disponibles para
4
TIPOS Y CLASES DE HIPOTESIS
En esencia, existen dos tipos diferentes de hipótesis:
1. Hipótesis nula (H0). Es definida como una manifestación que reclama la ausencia
de la diferencia entre valores o variables supuestas o hipotéticas y la media de la
población. Esta hipótesis refuta, niega o plantea lo contrario de la hipótesis de
investigación y suele plantear que no existen diferencias.
2. Hipótesis de investigación (H1). Se le conoce también como hipótesis de
trabajo, alternativa (HA) o estadística, y es una manifestación en desacuerdo de la
hipótesis nula.
Estos dos tipos de hipótesis pueden ser de cuatro clases diferentes:
Descriptiva. Este tipo de hipótesis sólo intenta describir el valor de las variables que
se van a observar en el contexto o en la manifestación de otra variable.
2. Correlaciónales. Son hipótesis que especifican la correlación entre dos
variables. Las hipótesis de este tipo pueden establecer asociación, predicción o ser
explicativas, pero nunca causales.
3. Diferenciales. Son hipótesis que intentan definir diferencias entre grupos.
5
HIPOTESIS NULA Y ALTERNATIVA
En estadística, una hipótesis es una afirmación sobre un parámetro de la población
(como la media o desviación estándar) y se representa con H0. [1][2] La hipótesis
nula es la afirmación de que dos (o más) parámetros o fenómenos no tienen
relación entre sí. Es un punto de partida para la investigación que no se rechaza a
menos que los datos de la muestra parezcan evidenciar que es falsa.
Técnicamente, la hipótesis nula es una aplicación a la estadística del método de
reducción al absurdo, por el cual se supone, en principio, lo contrario de lo que se
desea probar, hasta que la evidencia o las conclusiones obtenidas demuestran que
el punto de partida fue falso o absurdo y, por tanto, se rechaza y se concluye lo
contrario (lo que se quería probar). Dado que la hipótesis nula tiene la forma lógica
de un enunciado universal, para afirmar que la hipótesis nula es verdadera se
requiere estudiar a toda la población. La hipótesis nula generalmente incluye un no
en su enunciado.
El término hipótesis nula surge de las primeras aplicaciones agrícolas y médicas de
la estadística. Con el fin de probar la efectividad de un nuevo fertilizante o una
nueva medicina, la hipótesis de la cual se parte es que no hubo efecto es decir no
hubo diferencia entre las muestras tratadas y no tratadas.
Las hipótesis nula y alternativa son dos enunciados mutuamente excluyentes
acerca de una población. Una prueba de hipótesis utiliza los datos de la muestra
para determinar si se puede rechazar la hipótesis nula.
Hipótesis nula (H0) La hipótesis nula indica que un parámetro de población (tal
como la media, la desviación estándar, etc.) es igual a un valor hipotético. La
hipótesis nula suele ser una afirmación inicial que se basa en análisis previos o en
conocimiento especializado. Hipótesis alternativa (H1) La hipótesis alternativa
indica que un parámetro de población es más pequeño, más grande o diferente del
valor hipotético de la hipótesis nula. La hipótesis alternativa es lo que usted podría
pensar que es cierto o espera probar que es cierto.
HIPOTESIS UNILATERALES Y BITATERALES
La hipótesis alternativa puede ser unilateral o bilateral. Bilateral Utilice una hipótesis
alternativa bilateral (también conocida como hipótesis no direccional) para
determinar si el parámetro de población es mayor que o menor que el valor
hipotético. Una prueba bilateral puede detectar cuándo el parámetro de población
difiere en cualquier dirección, pero tiene menos potencia que una prueba unilateral.
Hipotético en una dirección específica. 6
Usted puede especificar la dirección para que sea mayor que o menor que el valor
hipotético. Una prueba unilateral tiene mayor potencia que una prueba bilateral,
pero no puede detectar si el parámetro de población difiere en la dirección opuesta.
7
ERROR TIPO 1 Y ERROR TIPO 2
ERROR TIPO 1
El error de tipo I también denominado error de tipo alfa (α) o falso positivo, es el
error que se comete cuando el investigador no acepta la hipótesis nula siendo ésta
verdadera en la población. Es equivalente a encontrar un resultado falso positivo,
porque el investigador llega a la conclusión de que existe una diferencia entre las
hipótesis cuando en realidad no existe. Se relaciona con el nivel de significancia
estadística.
En un estudio de investigación, el error de tipo I, también denominado error de tipo
alfa (α)[1] o falso positivo, es el error que se comete cuando el investigador rechaza
la hipótesis nula ( H 0 {\displaystyle H_{0}} H_0: el supuesto inicial) siendo esta
verdadera en la población. Es equivalente a encontrar un resultado falso positivo,
porque el investigador llega a la conclusión de que existe una diferencia entre las
hipótesis cuando en realidad no existe. Se relaciona con el nivel de significancia
estadística.
ERROR TIPO 2
El error de tipo II también llamado error de tipo beta (β) o falso negativo, es el error
que se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa
en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya
que el investigador llega a la conclusión de que ha sido incapaz de encontrar una
diferencia que existe en la realidad.
Contrariamente al error tipo I, en la mayoría de los casos no es posible calcular la
probabilidad del error tipo II. La razón de esto se encuentra en la manera en que se
formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula
representa siempre una afirmación enérgica. Error de tipo II, también llamado error
de tipo beta (β) (β es la probabilidad de que exista este error) o falso negativo, se
comete cuando el investigador no rechaza la hipótesis nula siendo esta falsa en la
población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el
investigador llega a la conclusión de que ha sido incapaz de encontrar una
diferencia que existe en la realidad.
8
Contrariamente al error tipo I, en la mayoría de los casos no es posible calcular la
probabilidad del error tipo II. La razón de esto se encuentra en la manera en que se
formulan las hipótesis en una prueba estadística. Mientras que la hipótesis nula
representa siempre una afirmación enérgica (como por ejemplo H 0 : {\displaystyle
H_{0}:} {\displaystyle H_{0}:} «Promedio μ = 0») la hipótesis alternativa, debido a
que engloba todas las otras posibilidades, es generalmente de naturaleza global
(por ejemplo H 1 : {\displaystyle H_{1}:} {\displaystyle H_{1}:} «Promedio μ ≠ 0» ). El
gráfico de la derecha ilustra la probabilidad del error tipo II (rojo) en dependencia
del promedio μ desconocido.
El poder o potencia del estudio representa la probabilidad de observar en la
muestra una determinada diferencia o efecto, si existe en la población. Es el
complementario del error de tipo II (1 − β).
9
PRUEBA DE HIPOTESIS Z PARA LA MEDIA (DESVIACION ESTANDAR
POBLACION CONOCIDA)
DESVIACION ESTANDAR
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. Mientras mayor sea la
desviación estándar, mayor será la dispersión de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación
estándar de una población, mientras que s se utiliza para representar la desviación
estándar de una muestra. La variación que es aleatoria o natural de un proceso se
conoce comúnmente como ruido.
La desviación estándar se puede utilizar para establecer un valor de referencia para
estimar la variación general de un proceso.
10
POBLACION CONOCIDA
El tamaño muestra dependerá de decisiones estadísticas y no estadísticas, pueden
incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que
estará en campo.
Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:
1. Tamaño de la población. Una población es una colección bien definida de objetos
o individuos que tienen características similares. Hablamos de dos tipos: población
objetivo, que suele tiene diversas características y también es conocida como la
población teórica. La población accesible es la población sobre la que los
investigadores aplicaran sus conclusiones.
2. Margen de error (intervalo de confianza). El margen de error es una estadística
que expresa la cantidad de error de muestreo aleatorio en los resultados de una
encuesta, es decir, es la medida estadística del número de veces de cada 100 que
se espera que los resultados se encuentren dentro de un rango específico.
3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con
una determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95%
significa que los resultados de una acción probablemente cubrirán las expectativas
el 95% de las veces.
4. La desviación estándar. Es un índice numérico de la dispersión de un conjunto de
datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión
de la población.
11
PRUEBA PARA PROPORCIONES
Las pruebas de proporciones son adecuadas cuando los datos que se están
analizando constan de cuentas o frecuencias de elementos de dos o más clases. El
objetivo de estas pruebas es evaluar las afirmaciones con respecto a una proporción
(o Porcentaje) de población. Las pruebas se basan en la premisa de que una
proporción muestral (es decir, x ocurrencias en n observaciones, o x/n) será igual a
la proporción verdadera de la población si se toman márgenes o tolerancias para la
variabilidad muestral. Las pruebas suelen enfocarse en la diferencia entre un número
esperado de ocurrencias, suponiendo que una afirmación es verdadera, y el número
observado realmente. La diferencia se compara con la variabilidad prescrita mediante
una distribución de muestreo que tiene como base el supuesto de que es realmente
verdadera.
En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de
medias, excepto que, en el caso de las primeras, los datos muéstrales se consideran
como cuentas en lugar de como mediciones. Por ejemplo, las pruebas para medias
y proporciones se pueden utilizar para evaluar afirmaciones con respecto a:
1) Un parámetro de población único (prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y
3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).
Además, para tamaños grandes de muestras, la distribución de muestreo adecuada
para pruebas de proporciones de una y dos muestras es aproximadamente normal,
justo como sucede en el caso de pruebas de medias de una y dos muestras.
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con
respecto a la proporción de una población, es adecuado utilizar una prueba de una
muestra. La metodología de prueba depende de si el número de observaciones de
la muestra es grande o pequeño. Como se habrá observado anteriormente, las
pruebas de grandes muestras de medias y proporciones son bastante semejantes.
De este modo, los valores estadísticos de prueba miden la desviación de un valor
estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se basan
en la distribución normal estándar para valores críticos. Quizá la única diferencia
real entre las ambas radica en la forma corno se obtiene la desviación estándar de
la distribución de muestreo.
12
SELECCIÓN DEL TAMAÑO DE MUESTRA (PARA ESTIMAR LA MEDIA
POBLACIONAL)
TAMAÑO DE MUESTRA EN LA ESTIMACIÓN DE LA MEDIA DE UNA
POBLACIÓN
En este artículo, se trata de explicar una metodología estadística sencilla y sobre
todo práctica, para la estimación del tamaño de muestra a utilizar, en los controles
referentes a variables de calidad de poblaciones que se distribuyen según la Ley
Normal. No se pretende en ningún caso, en entrar en temas teóricos de estadística,
sino que se pretende poder utilizar esta técnica de forma sencilla, práctica y sobre
todo fácil de entender en su aplicación.
¿De qué depende el tamaño muestral?
a) De la variabilidad del parámetro a estimar. b) Nivel de confianza (1 – a),
normalmente 95% o 99%
Si se aumenta el tamaño muestral n, se puede mejorar la calidad de la estimación,
ya sea aumentando la precisión (disminuye la amplitud del intervalo), o bien
disminuyendo el error admitido.
CÁLCULO DEL TAMAÑO DE LA MUESTRA, PARA ESTIMAR LA MEDIA
POBLACIONAL
1) Conocido el tamaño de la población, y la desviación standard de la misma:
N: tamaño de la población
Z: valor de la tabla normal estandarizada, correspondiente al nivel de confianza
deseado.
σ2: Varianza poblacional, de donde se va a sacar la muestra
D: Tolerancia o error permisible, o mitad de la amplitud del intervalo
No conocido el tamaño de la población, pero sí su desviación standard:
Z: valor de la tabla Normal estandarizada, correspondiente al nivel de confianza
deseado.
σ2: varianza poblacional, de donde se va a sacar la muestra.
D: tolerancia o error permisible, o mitad de la amplitud del intervalo de confianza
deseado.
13
SELECCIÓN DE TAMAÑO DE MUESTRA (PARA ESTIMAR LA PROPORCION
POBLACIONAL)
El tamaño de la muestra que debemos escoger para hacer una estimación del
parámetro con las características especificadas (de nivel de confianza y error de
estimación.) es un problema de gran importancia ya que:
Si tomamos una muestra más grande de la indicada para alcanzar los resultados
propuestos, constituye un desperdicio de recursos (tiempo, dinero, etc.); mientras
que una muestra demasiado pequeña conduce a menudo a resultados poco
confiables. Cuando elegimos una muestra de tamaño n sólo revisamos una fracción
o parte de la población y con base en ella tomamos decisiones que afectan a toda
la población. Es evidente que por este procedimiento se abre la posibilidad de que
nos equivoquemos en nuestras decisiones, pero esta posibilidad depende en gran
medida del tamaño de muestra o fracción de población que se haya analizado. El
tamaño que debe tener la muestra depende del nivel de confianza propuesto, así
como del máximo error que estemos dispuestos a admitir entre el valor estimado y
el valor real del parámetro que corresponde al error de estimación. Veamos cómo
se determinaría el tamaño de la muestra a partir de la consideración del nivel de
confianza y del error de estimación cuando hacemos muestreo con repetición o en
poblaciones infinitas. Supongamos que d es el error de estimación (precisión) y el
nivel de confianza.
14
CONCLUSION
Las muestras que se utilizan en este medio de estudio no sólo pueden ser
personas, sino que también se trata de elementos físicos tangibles y en ocasiones
elementos no tangibles, esto será determinado por ese tipo de estudio que se
realice y los objetivos que se deseen alcanzar.
Las muestras se toman de un pequeño universo, el cual puede o no ser parte de
otro más grande y se define como un elemento en la investigación en curso, por
ejemplo, se puede tomar una muestra de gente enferma de tos, dentro del universo
de una institución de salud, en la cual se pueden encontrar personas con distintos
padecimientos. Definir el universo o segmento se hace antes de cualquier
procedimiento matemático que contenga el trabajo.
15
FUENTE BIBLIOGRAFICA
EditarBetz, M.A. & Gabriel, K.R., "Type IV Errors and Analysis of Simple
Effects", Jornal of Educacional Statistics, Vol.3, No.2, (Summer 1978),
pp. 121–144.
David, F.N., "A Power Function for Tests of Randomness in a Sequence
of Alternatives", Biometrika, Vol.34, Nos.3/4, (December 1947), pp. 335–
339.
Fisher, R.A., The Design of Experiments, Oliver & Boyd
La hipótesis de la cual se parte es que no hubo efecto, es decir, no hubo
diferencia entre las muestras tratadas y no tratadas.[4]
ReferenciasEditar↑ (cf.) Estadística aplicada a los negocios y a la
economía. Décimo quinta edición. Lind, Marchal & Wathen. pp.336
↑ Mario., Triola,; Roberto., Hernández Ramírez, (2009). Estadística (10a.
ed edición). Pearson Educación. ISBN 9789702612872. OCLC 758180839.
Consultado el 22 de octubre de 2018.
↑ a b c (cf.) Estadística aplicada a los negocios y a la economía. Décimo
quinta edición. Lind, Marchal & Wathen. Mc Graw Hill. pp.336
↑ a b I., Levin, Richard (2004). Estadística para administración y
economía (7a. ed edición). Pearson Educación. ISBN 9702604974. OCLC
503373118. Consultado el 22 de octubre de 2018
16