0% encontró este documento útil (0 votos)
662 vistas22 páginas

Métodos No Paramétricos: Análisis II

Este documento presenta varios métodos estadísticos no paramétricos y cómo aplicarlos. Explica la prueba de los signos y cómo usarla para analizar datos antes y después de un programa de capacitación. También cubre cómo aproximar la distribución binomial con la normal cuando la muestra es grande, y un ejemplo de usar esta aproximación para analizar los resultados de una prueba de preferencia de sabores de refresco entre dos opciones. Además, introduce conceptos como pruebas de hipótesis sobre medianas y rangos, así como correlación por orden de

Cargado por

ed
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
662 vistas22 páginas

Métodos No Paramétricos: Análisis II

Este documento presenta varios métodos estadísticos no paramétricos y cómo aplicarlos. Explica la prueba de los signos y cómo usarla para analizar datos antes y después de un programa de capacitación. También cubre cómo aproximar la distribución binomial con la normal cuando la muestra es grande, y un ejemplo de usar esta aproximación para analizar los resultados de una prueba de preferencia de sabores de refresco entre dos opciones. Además, introduce conceptos como pruebas de hipótesis sobre medianas y rangos, así como correlación por orden de

Cargado por

ed
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

[Fecha] METODOS NO

PARAMETRIC
OS
CATEDRATICO: LIC. ANALISIS II
SERGIO GERARDO PADILLA HERNANDEZ

INTEGRANTES CUENTA N°

ANA MARINA LOPEZ FUNES 20151902168

STEPHANYE DAYANARA AGYILAR PAZ 20151900299

YENI DANIELA AVILA MALDONADO 20111011387

ALDIN ABEL CABRERA REYES 20141900024

ALLAN RICARDO PADILLA RIOS 20121902305

EDMON BLADIMIR ZELAYA RIVERA 20101900302

OBEDD HENOCK LAINEZ AMADOR 20121902212

Ricardo
[NOMBRE DE LA EMPRESA]
INDICE

Contenido
OBJETIVOS.....................................................................................................................................2
INTRODUCCION.............................................................................................................................3
¿Qué es un método no paramétrico?.......................................................................................4
PRUEBA DE LOS SIGNOS..........................................................................................................4
Uso de la aproximación normal a la binomial........................................................................8
Prueba de hipótesis acerca de una mediana.........................................................................9
Prueba de rangos con signo de Wilcoxon para muestras dependientes......................10
Prueba de Wilcoxon de la suma de rangos para muestras independientes.................13
Prueba de Kruskal-Wallis: análisis de la varianza por rangos.........................................15
Correlación por orden de rango..............................................................................................17
Prueba de significancia para rs...............................................................................................19
CONCLUSIONES..........................................................................................................................21
OBJETIVOS

GENERAL
Aplicar en forma adecuada técnicas estadísticas No Paramétricas sobre
asociación entre variables y verificación de los supuestos necesarios para que se
puedan aplicar estos métodos en el área de la investigación y de informes
estadísticos.

ESPECIFICOS
 Aplicar el modelo No Paramétrico más indicado a un problema específico,
dependiendo del diseño muestral utilizado y de las características
específicas del problema objeto de estudio

 Generalizar los modelos no paramétricos de las muestras, ya sea


independiente o dependientes.
INTRODUCCION

Las técnicas estadísticas de estimación de parámetros, intervalos de confianza y


prueba de hipótesis son, en conjunto, denominadas ESTADÍSTICA
PARAMÉTRICA y son aplicadas básicamente a variables continuas. Estas
técnicas se basan en especificar una forma de distribución de la variable aleatoria
y de los estadísticos derivados de los datos.
En ESTADÍSTICA PARAMÉTRICA se asume que la población de la cual la
muestra es extraída es NORMAL o aproximadamente normal. Esta propiedad es
necesaria para que la prueba de hipótesis sea válida.
Sin embargo, en un gran número de casos no se puede determinar la distribución
original ni la distribución de los estadísticos por lo que en realidad no tenemos
parámetros a estimar. Tenemos solo distribuciones que comparar. Esto se llama
Estadística No Paramétrica.
¿Qué es un método no paramétrico?
Una prueba no paramétrica es una prueba de hipótesis que no requiere que la
distribución de la población sea caracterizada por ciertos parámetros. Por ejemplo,
muchas pruebas de hipótesis parten del supuesto de que la población sigue una
distribución normal con los parámetros μ y σ. Las pruebas no paramétricas no
parten de este supuesto, de modo que son útiles cuando los datos son
considerablemente no normales y resistentes a transformaciones.

En un método no paramétrico, se presupone que la distribución de la que proviene


la muestra no está especificada y, con frecuencia, se desea hacer inferencias
sobre el centro de la distribución. Por ejemplo, muchas pruebas de la estadística
paramétrica, como la prueba t de 1 muestra, se realizan bajo el supuesto de que
los datos provienen de una población normal con una media desconocida. En un
estudio no paramétrico, se elimina el supuesto de normalidad.

Los métodos no paramétricos son útiles cuando no se cumple el supuesto de


normalidad y el tamaño de la muestra es pequeño. Sin embargo, las pruebas no
paramétricas no están completamente libres de supuestos acerca de los datos.
Por ejemplo, es fundamental presuponer que las observaciones de las muestras
son independientes y provienen de la misma distribución. Además, en los diseños
de dos muestras, se requiere el supuesto de igualdad de forma y dispersión.

PRUEBA DE LOS SIGNOS


La prueba de los signos se basa en el signo de una diferencia entre dos
observaciones relacionadas.
En general, se designa con un signo más (+) una diferencia positiva, y Con un
signo menos (–), una negativa.
La prueba de los signos tiene muchas aplicaciones. Una es para experimentos de
“antes/después”.
El director de sistemas de información de Samuelson Chemicals recomendó la
elaboración de un programa de capacitación para gerentes en la planta. Se
seleccionó de forma aleatoria una muestra de 15 gerentes. Un panel de expertos
en bases de datos determino el nivel general de conocimientos de cada gerente
respecto del uso de las bases de datos. Su competencia y comprensión se
calificaron como sobresalientes, excelentes, buenas, regulares o deficientes.
Después del programa de capacitación de tres meses, el mismo panel de expertos
en sistemas de información califico a cada gerente una vez más. Las dos
calificaciones (antes y después) aparecen con el signo de la diferencia. Un signo
“+” indica una mejora, y un signo “–”, que la competencia del gerente para las
bases de datos declino después del programa de capacitación.
Paso 1: Formule las hipótesis nula y alternativa.
 H0: π ≤ 0.50
No hay aumento en el conocimiento del uso de las bases de datos como
resultado del programa de capacitación en la planta.
 H1: π > 0.50
Existe un aumento del conocimiento en el uso de las bases de datos de los
gerentes después del programa de capacitación.

Paso 2: Seleccione un nivel de significancia.


Elija un nivel de 0.10.
Paso 3: Decida sobre el estadístico de prueba.
Es el número de signos más que resulten del experimento.
Paso 4: Formule una regla de decisión.
 En el curso de capacitación se inscribieron 15 gerentes, pero Andy Love no
mostro aumento ni reducción en la competencia. Por tanto, se eliminó del
estudio debido a que no se pudo incluir en ningún grupo, entonces n = 14,
una probabilidad de 0.50.
 El número de éxitos aparece en la columna 1
 Las probabilidades de éxito en la columna 2
 Las probabilidades acumuladas en la 3. Para llegar a las probabilidades
acumuladas, sume las probabilidades de éxito en la columna 2 desde la
parte inferior.
¿Qué procedimiento se sigue para una prueba de dos colas? Se combinan
(suman) las probabilidades de éxito en las dos colas hasta estar lo más cerca
posible del nivel de significancia deseado (α) sin sobrepasarlo

Paso 5: Tome una


decisión respecto de la hipótesis nula.
 Once de los 14 gerentes en el curso de capacitación aumentaron su
competencia para las bases de datos. El numero 11 está en la región de
rechazo, que inicia en 10, por tanto, se rechaza H0.
 Conclusión: el curso de capacitación de tres meses fue eficaz; incrementa
la competencia de los gerentes.
Uso de la aproximación normal a la binomial
Si el número de observaciones en la muestra es mayor que 10, puede utilizar la
distribución normal para aproximar la binomial.

X es el número de signos más o menos, se aplica cuando una distribución continúa como
la normal (que se está utilizando). Sirve para aproximar una distribución discreta (la
binomial).

EJEMPLO
El departamento de investigación de mercado de Cola, Inc., tiene la tarea de
probar una nueva bebida de cola. Se consideran dos versiones de la bebida, un
refresco más bien dulce y uno un tanto amargo. La prueba de preferencia que se
realizara consiste en una muestra de 64 consumidores. Cada consumidor
degustara las dos bebidas de cola, la dulce (con la etiqueta A) y la amarga (con la
etiqueta B), e indicara su preferencia. Realice una prueba de hipótesis para
determinar si hay una diferencia en la preferencia por el refresco dulce o por el
amargo. Utilice un nivel de significancia de 0.05.
Paso 1: Formule las hipótesis nula y alternativa.
H0: π = 0.50 No hay preferencia.
H1: π ≠ 0.50 Si hay preferencia.
Paso 2: Seleccione un nivel de significancia.
Es de 0.05, indicado en el problema.

Paso 3: Seleccione el estadístico de prueba.


Es z, dado en la formula
Z = (X ± 0.50) − μ
σ
Donde μ = 0.50n y σ = 0.50√n.
 Paso 4: Formule la regla de decisión.
 Paso 5: Calcule z, compare el valor calculado con el valor crítico y
tome una decisión respecto de H0.
A la preferencia por el refresco A se le asignó un signo “+”, y a la preferencia por
el B, un signo “–”. De las 64 personas de la muestra, 42 prefirieron el sabor dulce,
que es el refresco A. Por tanto, hay 42 signos más. Como 42 es mayor que n/2 =
64/2 = 32, emplee la fórmula 18.2 para z:

El valor z calculado de 2.38 es mayor que el valor critico de 1.96. Por tanto, se
rechaza la hipótesis nula de que no hay diferencia con un nivel de significancia de
0.05. Conclusión: los consumidores prefieren el refresco de cola dulce al otro.

Prueba de hipótesis acerca de una mediana


Mediana es el valor sobre del cual están la mitad de las observaciones y debajo
del cual encontramos la otra mitad.
Para realizar una prueba de hipótesis, a un valor por arriba de la mediana se le da
un signo más, y a un valor debajo de la mediana, un signo menos. Si un valor es el
mismo que la mediana, se elimina en el análisis posterior.

EJEMPLO
Un estudio realizado hace varios años por el departamento de investigación del
consumidor de Superior Groceries determino que la cantidad mediana semanal
gastada en abarrotes por matrimonios jóvenes era $123. El director ejecutivo
quiere repetir el estudio para determinar si cambio la cantidad mediana gastada.
La información de la nueva muestra del departamento revelo que, en una muestra
aleatoria de 102 matrimonios jóvenes, 60 gastaron más de $123 la semana
pasada en abarrotes, 40 gastaron menos y 2 gastaron exactamente $123. Con un
nivel de significancia de 0.10, ¿es razonable concluir que la cantidad mediana
gastada no es igual a $123?

Las hipótesis nula y alternativa son:


H0: Mediana = $123
H1: Mediana ≠ $123
Esta es una prueba de dos colas debido a que la hipótesis alternativa no indica
una dirección. Es decir, no interesa si la mediana es menor o mayor que $123,
solo que es diferente a $123. El estadístico de prueba cumple con las
suposiciones binomiales. Falta

Prueba de rangos con signo de Wilcoxon para muestras


dependientes
En 1945, Frank Wilcoxon desarrollo una prueba no paramétrica, con base en las
diferencias en muestras dependientes, que no requiere la suposición de
normalidad.
Esta prueba se denomina prueba de rangos con signo de Wilcoxon

Ficker’s es una cadena de restaurantes familiares ubicada sobre todo en el


sureste de Estados Unidos, que ofrece un menu muy completo, pero su
especialidad es el pollo. Hace poco, Bernie Frick, propietario y fundador, elaboro
un nuevo sabor con especias para la salsa en la que se cocina el pollo. Antes de
reemplazar el sabor actual, quiere realizar algunas pruebas para estar seguro de
que a los comensales les gusta mas este nuevo sabor.
Para iniciar, Bernie selecciona una muestra aleatoria de 15 clientes. A cada cliente
de la muestra le da una pieza de pollo actual y le pide que califique su sabor en
una escala de 1 a 20. Un valor cercano a 20 indica que al participante le gusto el
sabor, en tanto que una calificación cerca de 1 indica que no le gusto el sabor.
Luego,
a los mismos 15 participantes les da una muestra del pollo con el nuevo sabor a
especias y una vez mas les pide calificar su sabor en una escala de 1 a 20. Los
resultados aparecen en la siguiente tabla. .Es razonable concluir que el sabor a
especias es el preferido? Utilice un nivel de significancia de 0.05.

Las muestras son dependientes o están relacionadas. Es decir, a los participantes


se les pide calificar los dos sabores del pollo. Por tanto, si calcula la diferencia
entre la calificación del sabor a especias y la del sabor actual, el valor resultante
muestra que la cantidad de participantes favorecen un sabor en comparación con
el otro.

H0: No hay diferencia en las calificaciones de los dos sabores.


H1: Las calificaciones son más altas para el sabor a especias.
Se trata de una prueba de una cola. ¿Por qué? Porque Bernie Frick, propietario de
Fricker´s, cambiara el sabor del pollo solo si los participantes en la muestra indican
que a la poblacion de clientes le gusta más el nuevo sabor. El nivel de
significancia para la prueba es de 0.05, como se indicó antes.
Los pasos para realizar la prueba de rangos con signo de Wilcoxon son los
siguientes:
1. Calcule la diferencia entre la calificación del sabor a especias y la del sabor
actual de cada participante.
2. Sólo se consideran las diferencias positivas y negativas en el análisis
posterior. Es decir, si la diferencia en las calificaciones del sabor es 0, ese
participante se elimina de un análisis posterior y se reduce el número en la
muestra.
3. Determine las diferencias absolutas para los valores calculados en la
columna 4. Recuerde que en una diferencia absoluta se ignora el signo de
la diferencia. Las diferencias absolutas se muestran en la columna 5.

4. Luego, ordene las diferencias absolutas de menor a mayor.

5. A cada clasificación asignada en la columna 6 se le da el mismo signo que


tenía en la diferencia original, y los resultados se reportan en la columna 7.
6. Se obtienen los totales de las columnas R+ y R–. La suma de los rangos
positivos es 75, y la suma de los rangos negativos es 30.
Prueba de Wilcoxon de la suma de rangos para muestras
independientes

Una prueba diseñada en específico para determinar si dos muestras


independientes provienen de poblaciones equivalentes es la prueba de Wilcoxon
de la suma de rangos. Esta prueba es una alternativa para la prueba t de dos
muestras descrita.
La prueba de Wilcoxon de la suma de rangos se basa en la suma de los rangos.
Los datos se clasifican como si las observaciones fueran parte de una sola
muestra. Si la hipótesis nula es verdadera, los rangos tendrán una distribución casi
uniforme entre las dos muestras, y la suma de los rangos para las dos muestras
será casi igual.

EJEMPLO
Dan
Thompson,
presidente de
CEO Airlines, hace poco observó un aumento en el número de personas que no
llegan a tomar los vuelos que salen de Atlanta. Su interés principal es determinar
si hay más personas que no se presentan a tomar los vuelos que salen de Atlanta
en comparación con vuelos que salen de Chicago. Una muestra de nueve vuelos
de Atlanta y ocho de Chicago aparece en la tabla 18.4. Con un nivel de
significancia de 0.05, ¿es posible concluir que hay más personas que no se
presentan a tomar los vuelos que salen de Atlanta?
H0: La distribución de la población de personas que no se presentan es la misma
o menor para Atlanta que para Chicago.
H1: La distribución de la población de las personas que no se presentan es mayor
para Atlanta que para Chicago.

H0: La distribución de la población de personas que no se presentaron es la


misma o mayor para Chicago que para Atlanta.
H1: La distribución de la población de personas que no se presentaron es menor
para Chicago que para Atlanta. El valor calculado de z es –1.49, determinado por:
Prueba de Kruskal-Wallis: análisis de la varianza por rangos

A un seminario sobre administración asisten ejecutivos de la industria


manufacturera, de finanzas y de ingeniería. Antes de programar las
sesiones del seminario, el instructor tiene interés en saber si los tres
grupos tienen los mismos conocimientos de los principios de la
administración. Los planes son tomar muestras de los ejecutivos de
manufactura, finanzas e ingeniería, y aplicar una prueba a cada uno.
Si no hay diferencias en las calificaciones de las tres distribuciones, el
instructor del seminario realizará sólo una sesión. Sin embargo, si hay
una diferencia en las calificaciones, se ofrecerán sesiones por
separado.

Se utilizará la prueba de Kruskal-Wallis en lugar de la prueba ANOVA


debido a que el instructor no quiere suponer que
1) las poblaciones de las calificaciones en administración siguen la
distribución normal ni que
2) las desviaciones estándar de las poblaciones son iguales

H0: Las distribuciones de las poblaciones de las calificaciones en


administración para las poblaciones de ejecutivos de manufactura,
finanzas e ingeniería son iguales.

H1: No todas las distribuciones de las poblaciones son iguales.


El paso siguiente es seleccionar muestras aleatorias de las tres poblaciones.
Seleccione una muestra de siete ejecutivos de manufactura, ocho de finanzas y
seis de ingeniería. Sus calificaciones en la prueba aparecen en la tabla

Al considerar las calificaciones como una sola población, la menor es la del


ejecutivo
de ingenieria, 35, por lo que se le asigna el rango 1. Hay dos calificaciones de 38.
Para resolver este empate, a cada calificación se le da un rango 2.5, determinado
Por (2 + 3)/2. Continúe este proceso para todas las calificaciones. La calificación
Mayor es 107, que corresponde a un ejecutivo en finanzas, y a ese ejecutivo se le
da un rango de 21. Las calificaciones, los rangos y la suma de los rangos para
cada una de las tres muestras aparecen en la tabla
Como el valor calculado de H (5.736) es menor que el valor critico de 5.991, no se
rechaza la hipótesis nula. No hay evidencia suficiente para concluir que existe una
diferencia entre los ejecutivos de manufactura, finanzas e ingeniería respecto de
sus conocimientos sobre los principios de administración. Desde un punto de vista
práctico, el instructor del seminario deberá considerar solo una sesión con los
ejecutivos de todas las áreas.

Correlación por orden de rango


Recuerde que r mide la asociación entre dos variables en escala de intervalo o de
razón. Por ejemplo, el coeficiente de correlación reporta la asociación entre el
salario de ejecutivos y sus años de experiencia, o la asociación entre el número de
millas que un embarque tiene que recorrer y el número de días que tarda en llegar
a su destino
El coeficiente de correlación por rangos se calcula mediante la siguiente formula

Donde
d es la diferencia entre los rangos por cada par.
n es el número de observaciones por pares.

Al igual que el coeficiente de correlación, el coeficiente de correlación por rangos


adopta cualquier valor en el intervalo de –1.00 a 1.00. Un valor de –1.00 indica
una correlacion negativa perfecta, y un valor de 1.00, una correlación positiva
perfecta entre los rangos. Una correlacion de rangos de 0 indica que no hay
asociacion entre los rangos. Correlaciones de rangos de –0.84 y 0.80 indican una
asociacion fuerte, pero la primera indica una relación inversa entre los rangos, y la
última, una relacion directa.

EJEMPLO
Lorrenger Plastics, Inc., contrata a gerentes en capacitacion provenientes de
universidadesde Estados Unidos. A cada aspirante, el reclutador le asigna una
calificaciondurante la entrevista en el campus. Esta calificacion es una expresion
del potencial futuro y varia de 0 a 15; la calificacion mas alta indica mas potencial.
Luego, los recien graduados ingresan a un programa de capacitacion en la planta
y reciben otra calificacion compuesta, con base en pruebas, opiniones de lideres
de grupo, oficiales de entrenamiento, etc. La calificacion en el campus y las
calificaciones en la planta aparecen en la tabla
Calcule el coeficiente de correlacion por rangos e interprete su valor. Se decidio
clasificar las variables de baja a alta. La calificacion mas baja del reclutador en el
campus fue un 4 para el graduado D, por lo que se le dio el rango 1. La siguiente
calificacion mas baja fue un 7 a un graduado H, por lo que se le dio el rango 2.

Hubo dos graduados con rango 8. El empate se resuelve al dar a cada uno un
rango de 3.5, que es el promedio de los rangos 3 y 4. Se sigue el mismo
procedimiento cuando hay más de dos calificaciones iguales. Por ejemplo,
observe que la calificacion mas baja en la capacitacion es 3, y se le da un rango
de 1. Luego hay tres calificaciones de 4. El promedio de los tres rangos
empatados es 3, determinado mediante (2 + 3 + 4)/3. En la tabla 18.9 se ilustra lo
anterior, ademas de los cálculos necesarios para rs.

Prueba de significancia para rs


Para datos clasificados surge la duda de que la correlacion en la poblacion en
realidad sea cero. Por ejemplo, en la muestra del caso anterior se tomo a 12
graduados. En la solucion del ejemplo, el coeficiente de correlacion por rangos de
0.726 indica una relacion un tanto fuerte entre los dos conjuntos de rangos. .Es
posible que la correlacion de 0.726 sea por casualidad, y que la correlacion entre
los rangos en la poblacion de verdad sea 0? Ahora realizara una prueba de
significancia para despejar esa duda.
La regla de decision es rechazar H0 si el valor calculado de t es mayor que 1.812
(del apendice B.2, con un nivel de significancia de 0.05, prueba de una cola y 10
grados de libertad, determinado mediante n – 2 = 12 – 2 = 10).El valor calculado
de t es 3.338:

Se rechaza H0 debido a que el valor t calculada de 3.338 es mayor que 1.812. Se


acepta H1. Hay evidencia de una correlación positiva entre los rangos dados por el
reclutador en el campus y los rangos asignados durante la capacitación.
CONCLUSIONES

Las pruebas estadísticas no paramétricas auxilian a la toma de decisiones, los


casos donde la estadística paramétrica no puede aplicarse y las pruebas de
criterio son insuficientes. Es decir, ante la necesidad de contar con una base
estadística y no poder aplicar las pruebas paramétricas típicas, ya sea por falta de
conocimiento de los datos o porque las suposiciones de modelo no pueden
cumplirse, el investigador puede optar por emplear una prueba no paramétrica.

También podría gustarte