ÍNDICE
4.1- ESCALAS DE MEDICIÓN ..................................................... 3
1. NOMINAL : ....................................................................................................................................................................................3
2. ORDINAL : .....................................................................................................................................................................................4
3. INTERVALO: ..................................................................................................................................................................................5
4. RAZÓN: .........................................................................................................................................................................................6
4.2. MÉTODOS ESTADÍSTICOS PARAMÉTRICOS
CONTRA NO PARAMÉTRICOS ................................................. 8
MÉTODOS PARAMÉTRICOS .....................................................................................................................................................................9
MÉTODOS NO PARAMÉTRICOS ...............................................................................................................................................................9
VENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS ................................................................................................................................10
DESVENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS ..........................................................................................................................11
¿CÓMO PODRÍAN AFECTAR LOS ANÁLISIS ESTADÍSTICOS?....................................................................................................................11
4.3. PRUEBA DE RACHAS PARA ALEATORIEDAD ........... 13
REQUISITOS ...........................................................................................................................................................................................13
NOTACIÓN .............................................................................................................................................................................................13
4.4. UNA MUESTRA: PRUEBA DE SIGNOS ........................... 15
REQUISITOS ...........................................................................................................................................................................................15
NOTACIÓN .............................................................................................................................................................................................15
ESTADÍSTICO DE PRUEBA.......................................................................................................................................................................15
4.5. UNA MUESTRA: PRUEBA DE WILCOXON. .................. 16
EL PROCEDIMIENTO QUE SE UTILIZA: ....................................................................................................................................................16
4.6. DOS MUESTRAS: PRUEBA DE MANN-WHITNEY ....... 17
REQUISITOS ...........................................................................................................................................................................................17
NOTACIÓN .............................................................................................................................................................................................17
PROCEDIMIENTO PARA CALCULAR EL VALOR ESTADÍSTICO: .................................................................................................................18
CARACTERÍSTICAS DE LA PRUEBA U DE MANN WHITNEY......................................................................................................................19
4.7. OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS 20
REQUISITOS ...........................................................................................................................................................................................21
NOTACIÓN .............................................................................................................................................................................................21
1
4.8. OBSERVACIONES PAREADAS PRUEBA DE
WILCOXON ................................................................................... 22
REQUISITOS ...........................................................................................................................................................................................22
NOTACIÓN .............................................................................................................................................................................................23
ESTADÍSTICO DE PRUEBA.......................................................................................................................................................................23
VALORES CRÍTICOS ................................................................................................................................................................................23
4.9. VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE
KRAUSKAL-WALLIS .................................................................. 24
REQUISITOS ...........................................................................................................................................................................................25
NOTACIÓN .............................................................................................................................................................................................25
PROCEDIMIENTO PARA CALCULAR EL VALOR DEL ESTADÍSTICO DE PRUEBA H .....................................................................................26
4.10. APLICACIONES CON EL USO DE SOFTWARE
ESTADÍSTICA ............................................................................... 27
SOFTWARE ESTADÍSTICO .......................................................................................................................................................................27
OBJETIVO ...............................................................................................................................................................................................27
OBJETIVOS PARTICULARES ....................................................................................................................................................................28
PROCEDIMIENTO ...................................................................................................................................................................................28
REFERENCIAS BIBLIOGRÁFICAS: ....................................... 29
2
ESTADÍSTICA NO
PARAMÉTRICA
4.1- ESCALAS DE MEDICIÓN
Para que los datos tengan sentido es necesario compararlos. Y para poder compararlos
debemos utilizar escalas de medición. Dichas escalas tendrán diferentes propiedades en
función de las características de los datos que se compararán. En estadística existen cuatro
escalas de medición: nominal, ordinal, de intervalo y de razón.
TIPO ESCALA OPERATIVIDAD REQUISITO
Mutuamente excluyentes
Nominal Igualdad/desigualdad Exhaustividad
Ordinal Jerarquía mayor/menor Escalonamiento
Intervalos Comparación de intervalos Unidad constante
Razones Cero absoluto
Comparación continua
1. NOMINAL :
Cuando un dato identifica una etiqueta (o el nombre de un atributo) de un elemento, se
considera que la escala de medición es una escala nominal. En esta carecen de sentido el
orden de las etiquetas, así como la comparación y las operaciones aritméticas. La única
finalidad de este tipo de datos es clasificar a las observaciones.
En una escala nominal, la operación consiste en dividir una clase determinada en un conjunto
de subclases mutuamente excluyentes. La única relación envuelta es la de equivalencia,
simbolizada por el signo =, o su ausencia, por el símbolo ≠.
3
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia.
Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre
los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo
que NO cuenta con un orden lógico.
EJEMPLOS:
Sexo: 1) masculino; 2) femenino.
Fumar: 0) no; 1) sí.
Estado civil: 1, casado; 2, soltero; 3, viudo; 4, divorciado.
Procedencia del ingreso: 1, urgencias; 2, consultas; 3, otro hospital.
2. ORDINAL :
Cuando los datos muestran las propiedades de los datos nominales, pero además tiene sentido el orden
(o jerarquía) de estos, se utiliza una escala ordinal.
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia contando con un orden lógico.
Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez,
podemos identificar si una categoría es mayor o menor que otra.
En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no
es cuantificable o medible.
La diferencia fundamental entre una escala nominal y la ordinal estriba en que ésta incorpora
la relación de “mayor que” (>) o “menor que” (<) a la de equivalencia (=). Cualquier
transformación que no altere el orden de las clases es permisible. La mejor descripción de la
tendencia central es la mediana ya que ésta no se ve afectada por cambios de puntajes, en
tanto no se altere el número de cuentas sobre o bajo ella. Con la escala ordinal es posible usar
todo el rango de pruebas estadísticas conocidas como “estadísticas ordinales o de rango” o
“no paramétricas”. La única presunción de estas pruebas es que los puntajes deben ser
sacados de una distribución continua.
4
EJEMPLOS:
Clase social: 1) baja, 2) media, 3) alta.
Grados de reflujo vesicoureteral: grados 1, 2, 3, 4.
Conformidad con una afirmación: 0) completo desacuerdo, 1) acuerdo parcial, 2)
acuerdo total.
Fumar: 0) no fumador, 1) fumador leve, <10/día; 2) fumador moderado, 10-20/día, y
3) gran fumador, >20/día).
3. INTERVALO:
En una escala de intervalo, los datos tienen las propiedades de los datos ordinales, pero a su vez la
separación entre las variables tiene sentido. Este tipo de datos siempre es numérico, y el valor cero
no indica la ausencia de la propiedad.
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los
números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de
igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente
entre cada valor de la escala.
Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la
multiplicación y la división no son realizables.
Las operaciones y relaciones de una escala de intervalo son similares a la estructura de la
aritmética por lo que pueden utilizarse todas las operaciones. En una escala de intervalo se
puede reconocer la equivalencia (=) y el orden (>) y, además, las razones de cada intervalo.
Las pruebas paramétricas pueden y deben usarse si se cumplen las otras presunciones puesto
que las pruebas no paramétricas restan potencia al análisis al no usar toda la información
contenida en una escala de intervalo.
5
4. RAZÓN:
En una escala de razón, los datos tienen todas las propiedades de los datos de intervalo, y la
proporción entre ellos tiene sentido. Para esto se requiere que el valor cero de la escala
indique la ausencia de la propiedad a medir.
Las variables de razón poseen las mismas características de las variables de intervalo, con la
diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia
total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta,
Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables
permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son
algunos ejemplos de este tipo de escala de medida.
El orden de las escalas indica la cantidad relativa de información que contiene cada una de
las ellas. Las mediciones de un nivel de información concreto pueden transformarse o
reescalarse a un nivel inferior, pero no es posible reescalar las variables a un nivel superior
al que se midieron realmente.
La selección de una escala estará determinada por la definición operativa de la variable que
hayamos realizado y por los métodos disponibles para medirla. Para algunas variables solo
existirá un tipo de escala elegible, mientras que para la mayoría tendremos varias alternativas.
En general, siempre que sea posible, interesa utilizar en la recogida de datos la escala más
precisa, aunque no sea la que posteriormente se utilice en el tratamiento estadístico. Ello nos
permitirá adecuar la decisión, una vez conocida la verdadera distribución de nuestros datos.
EJEMPLO:
Peso: medido en kilogramos.
Concentración de glucosa en una muestra: medida en mg/dl.
Tasa de mortalidad: muertes por 1000 personas en riesgo.
Ingresos: medidos en euros.
6
7
4.2. MÉTODOS ESTADÍSTICOS
PARAMÉTRICOS CONTRA NO
PARAMÉTRICOS
El campo de la estadística existe porque generalmente es imposible recopilar datos de todos
individuos de interés (población). La solución es recopilar datos de un subconjunto (muestra)
de los individuos de interés, pero nuestro verdadero deseo es conocer la verdad sobre la
población. Y para esto es fundamental entender los conceptos Paramétrico y No Paramétrico.
Cantidades como medias, desviaciones estándar y proporciones son todas valores
importantes y se denominan «parámetros» cuando hablamos de una población. Como
generalmente no podemos obtener datos de toda la población, no podemos conocer los
valores de los parámetros para esa población. Sin embargo, podemos calcular estimaciones
de estas cantidades para nuestra muestra. Cuando se calculan a partir de datos de muestra,
estas cantidades son estadísticas. Así, una estadística estima un parámetro.
Hay algunas divisiones de temas en las estadísticas. Una división que rápidamente viene a la
mente es la diferenciación entre estadística descriptiva e inferencial . Hay otras formas en
que podemos separar la disciplina de las estadísticas. Una de estas formas es clasificar los
métodos estadísticos como paramétricos o no paramétricos.
Las pruebas paramétricas tienen requisitos acerca de la naturaleza o forma de las poblaciones
implicadas; las pruebas no paramétricas no requieren que las muestras provengan de
poblaciones con distribuciones normales o con cualquier otro tipo particular de distribución.
En consecuencia, las pruebas de hipótesis no paramétricas suelen llamarse pruebas de
distribución libre.
8
MÉTODOS PARAMÉTRICOS
Incluye estadística descriptiva, modelos estadísticos, inferencia y pruebas estadísticas. La
estructura del modelo de los modelos no paramétricos no se especifica a priori, sino que se
determina a partir de los datos. Esto no implica que tales modelos carecen por completo de
parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están
fijados de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una
distribución de probabilidad.
Los métodos se clasifican según lo que sabemos sobre la población que estamos
estudiando. Los métodos paramétricos suelen ser los primeros métodos que se estudian en
un curso de introducción a la estadística. La idea básica es que hay un conjunto de parámetros
fijos que determinan un modelo de probabilidad.
Los métodos paramétricos son a menudo aquellos para los que sabemos que la población es
aproximadamente normal, o podemos aproximarnos usando una distribución normal después
de invocar el teorema del límite central . Hay dos parámetros para una distribución normal:
la media y la desviación estándar.
MÉTODOS NO PARAMÉTRICOS
Para contrastar con los métodos paramétricos, definiremos métodos no paramétricos. Son
técnicas estadísticas para las que no tenemos que hacer ninguna suposición de parámetros
para la población que estamos estudiando. De hecho, los métodos no tienen ninguna
dependencia de la población de interés.
El conjunto de parámetros ya no es fijo, y tampoco lo es la distribución que utilizamos. Es
por esta razón que los métodos no paramétricos también se denominan métodos sin
distribución.
9
Algunos métodos no paramétricos incluyen:
Prueba de signos para media poblacional
Técnicas de arranque
Prueba U para dos medias independientes
Prueba de signos de una muestra
Prueba de los rangos con signo de Wilcoxon
Prueba U de Mann-Whitney
Prueba de Kruskal-Wallis
Prueba de la mediana de Mood
Prueba de Friedman
VENTAJAS DE LOS MÉTODOS NO
PARAMÉTRICOS
Los métodos no paramétricos pueden aplicarse a una amplia variedad de situaciones
puesto que no tienen los requisitos más estrictos de los métodos paramétricos
correspondientes. En particular, los métodos no paramétricos no requieren de
poblaciones distribuidas normalmente.
A diferencia de los métodos paramétricos, los métodos no paramétricos a menudo
pueden aplicarse a datos categóricos, como el género de quienes responden una
encuesta.
Los métodos no paramétricos, por lo regular, implican cálculos más sencillos que los
métodos paramétricos correspondientes y, por lo tanto, son más fáciles de
comprender y aplicar. (Sin embargo, como la tecnología ha simplificado los cálculos,
es probable que la facilidad de los cálculos no sea un factor tan importante).
10
DESVENTAJAS DE LOS MÉTODOS NO
PARAMÉTRICOS
Los métodos no paramétricos tienden a desperdiciar información porque los datos
numéricos exactos suelen reducirse a una forma cualitativa. Por ejemplo, en la prueba
del signo no paramétrica las pérdidas de peso de las personas sometidas a una dieta
se registran simplemente como signos negativos; las magnitudes reales de las
pérdidas de peso se ignoran.
Las pruebas no paramétricas no son tan eficientes como las pruebas paramétricas, de
manera que con una prueba no paramétrica generalmente necesitamos evidencia más
fuerte (como una muestra más grande o diferencias mayores) para rechazar una
hipótesis nula
¿CÓMO PODRÍAN AFECTAR LOS ANÁLISIS
ESTADÍSTICOS?
Ambas son dos clasificaciones amplias de procedimientos estadísticos.
Las pruebas paramétricas se basan en suposiciones sobre la distribución
subyacente de la población de la que se tomó la muestra.
11
Las pruebas no paramétricas no se basan en suposiciones sobre la forma o los
parámetros de la distribución de la población subyacente.
Si los datos se desvían fuertemente de los supuestos de uno de los procedimientos,
seguir utilizando el mismo podría conducir a conclusiones incorrectas.
Debemos conocer los supuestos asociados con ambos procedimientos y debemos
aprender métodos para evaluar la validez de esos supuestos.
Si determinamos que los supuestos de uno de los procedimientos no son válidos,
debemos usar un procedimiento análogo en su lugar.
El supuesto de normalidad es particularmente útil para una muestra pequeña. Las
pruebas no paramétricas suelen ser una buena opción para estos datos.
Puede ser difícil decidir si usar uno u otro procedimiento en algunos casos. Los
procedimientos no paramétricos generalmente tienen menos potencia que el
procedimiento paramétrico correspondiente si los datos son realmente normales.
La interpretación de procedimientos no paramétricos también puede ser más difícil
para los procedimientos paramétricos.
DIFERENCIAS
PARAMÉTRICA NO PARAMÉTRICA
Asume conocer como se distribuye Utiliza métodos para conocer la
la variable aleatoria. distribución de un fenómeno
Parte de la inferencia estadística Rama de la inferencia estadística
Fundamentada en distribuciones Fundamentada en distribuciones no
conocidas conocidas.
12
4.3. PRUEBA DE RACHAS PARA
ALEATORIEDAD
Esta prueba se basa en datos muestrales que tienen dos características y analiza rachas de
esas características para determinar si las rachas parecen ser el resultado de algún proceso
aleatorio, o si las rachas sugieren que el orden de los datos no es aleatorio.
Una racha es una secuencia de datos que tienen la misma característica; la secuencia es
precedida y seguida por datos con una característica diferente o por ningún dato en absoluto.
La prueba de rachas utiliza el número de rachas en una secuencia de datos muestrales para
probar la aleatoriedad del orden de los datos.
El principio fundamental de la prueba de rachas puede establecerse brevemente como sigue:
Rechace la aleatoriedad si el número de rachas es muy bajo o muy alto
REQUISITOS
Los datos muestrales están acomodados de acuerdo con algún esquema de orden, por
ejemplo, el orden en el que se obtuvieron los valores muestrales.
Cada valor de los datos se puede categorizar en una de dos categorías separadas
(como hombre/mujer).
NOTACIÓN
n1=número de elementos en la secuencia que tienen una característica particular (la
característica elegida para n1 es arbitraria).
n2=número de elementos en la secuencia que tienen la otra característica.
G=número de rachas Estadístico de Prueba
Para muestras pequeñas y α = 0.05: Si n1 ≤ 20 y n2 ≤ 20 y el nivel de significancia
es α = 0.05, el estadístico de prueba es el número de rachas G.
13
Los valores críticos se encuentran en la tabla de valores críticos para el número de rachas G.
Rechace la aleatoriedad si el número de rachas G es:
Menor o igual al valor crítico más pequeño encontrado en dicha tabla
Mayor o igual al valor crítico más grande encontrado en dicha tabla
Valores críticos de z, se utiliza la tabla de distribución normal
Datos numéricos: aleatoriedad por arriba o por debajo de la media o de la mediana Se puede
probar la aleatoriedad por la forma como los datos numéricos fluctúan por encima o por
debajo de una media o mediana.
Los economistas utilizan la prueba para detectar aleatoriedad por arriba y por debajo de la
media cuando tratan de identificar tendencias o ciclos.
Un patrón cíclico produciría una secuencia que cambia sistemáticamente, de manera que el
número de rachas tendería a ser grande.
14
4.4. UNA MUESTRA: PRUEBA DE SIGNOS
Consiste en convertir valores de datos en signos positivos y negativos, y luego hacer una
prueba para ver si hay una cantidad desproporcionadamente mayor de uno u otro signo.
Es una prueba no paramétrica (de distribución libre) que utiliza signos positivos y negativos
para probar diferentes aseveraciones, incluyendo:
Aseveraciones que implican datos muestrales apareados.
Aseveraciones que implican datos nominales.
Aseveraciones acerca de la mediana de una sola población
La idea básica que subyace en la prueba del signo es el análisis de las frecuencias de los
signos positivos y negativos para determinar si son significativamente diferentes.
REQUISITOS
Los datos muestrales se seleccionaron aleatoriamente.
No existe el requisito de que los datos muestrales provengan de una población con
una distribución particular, como una distribución normal.
NOTACIÓN
x= el número de veces que ocurre el signo menos frecuente
n= el número total de signos positivos y negativos combinados
ESTADÍSTICO DE PRUEBA
Cuando se aplica la prueba del signo en una prueba de una cola, necesitamos ser muy
cuidadosos para evitar obtener la conclusión equivocada cuando un signo ocurre
significativamente con más frecuencia que el otro, pero los datos muestrales contradicen la
hipótesis alternativa.
15
4.5. UNA MUESTRA: PRUEBA DE WILCOXON.
La prueba de Wilcoxon es una prueba estadísticamente asimétrica, que puede referirse a la
prueba de Suma de rango o la versión de prueba de Firma de rango, que compara dos grupos
emparejados. Las pruebas básicamente calculan la diferencia entre conjuntos de pares y
analizan estas diferencias para ver si son estadísticamente diferentes entre sí.
Esta prueba puede utilizarse para probar la aseveración de que una muestra proviene de una
población con una mediana específica.
EL PROCEDIMIENTO QUE SE UTILIZA:
1. Para cada dato calcule las diferencias restando el valor de la mediana hipotética de cada
valor.
2. Ignorar los signos de las diferencias, luego acomodar las diferencias de la menor a la mayor
y reemplazarlas por el valor del rango correspondiente. Cuando las diferencias tengan el
mismo valor numérico, asignar la media de los rangos implicados en el empate.
3. Agregar a cada rango el signo de la diferencia de la que provino.
4. Calcular la suma de los valores absolutos de los rangos negativos. También calcular la
suma de los rangos positivos.
5. Permitir que T sea la más pequeña de las dos sumas calculadas en el paso anterior.
6. Permitir que n sea el número de pares de datos para los que la diferencia no es 0
7. Determinar el estadístico de prueba y los valores críticos con base en el tamaño muestral.
8. Cuando se obtenga la conclusión, rechazar la hipótesis nula si los datos muestrales le
llevan a un estadístico de prueba que se ubica en la región crítica, esto es, cuando el
estadístico de prueba sea menor o igual que el valor crítico (s). De otra forma no rechazar la
hipótesis nula.
16
4.6. DOS MUESTRAS: PRUEBA DE MANN-
WHITNEY
La prueba de la suma de rangos de Wilcoxon es una prueba no paramétrica que utiliza rangos
de datos muestrales de dos poblaciones independientes.
Se aplica para la comparación de dos muestras independientes cuando las mismas tienen
pocos datos o no siguen una distribución normal. De esta manera, se considera que es una
prueba no paramétrica, a diferencia de su homóloga la prueba t de Student, que se usa
cuando la muestra es suficientemente grande y sigue la distribución normal.
La hipótesis alternativa es la aseveración de que las dos poblaciones tienen medianas
diferentes
Ho: Las dos muestras provienen de poblaciones con medianas iguales
H1: Las dos muestras provienen de poblaciones con medianas diferentes
REQUISITOS
Hay dos muestras independientes de datos seleccionados al azar.
Cada una de las muestras tienen más de 10 valores.
No existe el requisito de que las dos poblaciones tengan una distribución normal o
cualquier otra distribución particular.
NOTACIÓN
n1=tamaño de la muestra 1
n2=tamaño de la muestra 2
R1=suma de rangos de la muestra 1
R2=suma de rangos de la muestra 2
R=lo mismo que R1
μR=media de los valores muestrales R que se espera cuando las dos poblaciones
tienen medianas iguales
17
σR=desviación estándar de los valores muestrales R que se espera cuando las dos
poblaciones tienen medianas iguales
n2= tamaño de la otra muestra R=suma de rangos de la muestra con tamaño
n1 Valores críticos. Los valores críticos pueden encontrarse en la tabla de distribución
normal.
PROCEDIMIENTO PARA CALCULAR EL VALOR
ESTADÍSTICO:
1. Combinar temporalmente las dos muestras en una muestra grande, entonces reemplazar
cada valor muestral por su rango. Si los valores están empatados, asignarle la media de los
rangos implicados en el empate.
2. Consultar la suma de los rangos de las dos muestras.
3. Calcular el valor del estadístico de prueba z.
18
CARACTERÍSTICAS DE LA PRUEBA U DE MANN
WHITNEY
La prueba U de Mann – Whitney un test no-paramétrico, aplicable a muestras que no siguen
la distribución normal o con pocos datos. Tiene las siguientes características:
Compara las medianas.
Funciona sobre rangos ordenados.
Es menos potente, entendiéndose por potencia la probabilidad de rechazar la
hipótesis nula cuando en realidad es falsa.
Tomando en cuenta estas características, la prueba U de Mann – Whitney se aplica cuando:
Los datos son independientes.
No siguen la distribución normal.
La hipótesis nula H0 se acepta si las medianas de las dos muestras coinciden: Ma =
Mb
Se acepta la hipótesis alternativa H1 si las medianas de las dos muestras difieren: Ma
≠ Mb
19
4.7. OBSERVACIONES PAREADAS: PRUEBA
DE SIGNOS
La prueba de signos es un método estadístico para probar diferencias consistentes entre pares
de observaciones, como el peso de los sujetos antes y después del tratamiento.
Los pares de observaciones pueden ser designados x y y .
Para comparaciones de observaciones emparejadas ( x , y), la prueba de signo es más útil si
las comparaciones solo se pueden expresar como x > y , x = y , o x < y .
Si, en cambio, las observaciones se pueden expresar como cantidades numéricas ( x = 7, y =
18), o como rangos (rango de x = 1er, rango de y = 8vo), entonces la prueba t pareada [1] o
el Prueba de rango con signo de Wilcoxon [2] generalmente tendrá mayor poder que la
prueba de signos para detectar diferencias consistentes.
Si X e Y son variables cuantitativas, la prueba de signo puede usarse para probar la
hipótesis de que la diferencia entre X e Y tiene una mediana cero, asumiendo distribuciones
continuas de las dos variables aleatorias X e Y , en la situación en la que podemos
dibujar pares muestras de X y y .
Consiste en convertir valores de datos en signos positivos y negativos, y luego hacer una
prueba para ver si hay una cantidad desproporcionadamente mayor de uno u otro signo.
Es una prueba no paramétrica (de distribución libre) que utiliza signos positivos y negativos
para probar diferentes aseveraciones, incluyendo:
Aseveraciones que implican datos muestrales apareados.
Aseveraciones que implican datos nominales.
Aseveraciones acerca de la mediana de una sola población. La idea básica que
subyace en la prueba del signo es el análisis de las frecuencias de los signos positivos
y negativos para determinar si son significativamente diferentes.
20
REQUISITOS
Los datos muestrales se seleccionaron aleatoriamente.
No existe el requisito de que los datos muestrales provengan de una población con
una distribución particular, como una distribución normal.
NOTACIÓN
x= el número de veces que ocurre el signo menos frecuente n= el número total de
signos positivos y negativos combinados
Cuando se aplica la prueba del signo en una prueba de una cola, necesitamos ser muy
cuidadosos para evitar obtener la conclusión equivocada cuando un signo ocurre
significativamente con más frecuencia que el otro, pero los datos muestrales contradicen la
hipótesis alternativa.
Cuando se utiliza la prueba del signo con datos que están ordenados en pares, convertimos
los datos en bruto a datos con signos positivos y negativos como sigue:
1. Restamos cada valor de la segunda variable del valor correspondiente de la primera
variable
2. Registramos sólo el signo de la diferencia encontrada por el paso 1. Excluimos los
empates: es decir, excluimos todos los datos apareados en los que ambos valores son iguales
21
4.8. OBSERVACIONES PAREADAS PRUEBA
DE WILCOXON
Esta prueba puede utilizarse para probar la aseveración de que una muestra l proviene de una
población con una mediana específica.
El procedimiento que se utiliza:
1. Para par de datos, calcular la diferencia d restando el segundo valor del primero. Mantener
los signos, pero descartar cualquier par para el que d=0
2. Ignorar los signos de las diferencias, luego acomodar las diferencias de la menor a la mayor
y reemplácelas por el valor del rango correspondiente. Cuando las diferencias tengan el
mismo valor numérico, asignarles la media de los rangos implicados en el empate.
3. Agregar a cada rango el signo de la diferencia de la que provino.
4. Calcular la suma de los valores absolutos de los rangos negativos. También calcular la
suma de los rangos positivos.
5. Permitir que T sea la más pequeña de las dos sumas calculadas en el paso anterior.
6. Permitir que n sea el número de pares de datos para los que la diferencia no es 0
7. Determinar el estadístico de prueba y los valores críticos con base en el tamaño muestral.
8. Cuando se plantee la conclusión, rechazar la hipótesis nula si los datos muestrales llevan
a un estadístico de prueba que se ubica en la región crítica, esto es, cuando el estadístico de
prueba sea menor o igual que el valor crítico (s). De otra forma no rechazar la hipótesis nula.
REQUISITOS
Los datos consisten en datos apareados que se seleccionaron aleatoriamente.
La población de las diferencias (calculadas a partir de los pares de datos) tiene una
distribución que es aproximadamente simétrica, lo que quiere decir que la mitad
izquierda de su histograma es aproximadamente una imagen de espejo de la mitad
derecha. (No existe el requisito de que los datos tengan una distribución normal).
22
NOTACIÓN
T = la más pequeña de las siguientes sumas:
1. La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean
cero
2. La suma de los rangos positivos de las diferencias d que no sean cero.
ESTADÍSTICO DE PRUEBA
Si n ≤ 30, el valor crítico T se encuentra en la tabla de valores críticos de T para la prueba de
rangos con signo Wilcoxon.
VALORES CRÍTICOS
Si n ≤ 30, el valor crítico T se encuentra en la tabla de valores críticos de T para la
prueba de rangos con signo de Wilcoxon
Si n > 30, los valores críticos z se encuentra en la tabla de distribución normal
23
4.9. VARIAS MUESTRAS INDEPENDIENTES:
PRUEBA DE KRAUSKAL-WALLIS
La prueba de Kruskal Wallis toma su nombre de William Kruskal y W. Allen Wallis y se
utiliza en la estadística para corroborar si un conjunto de datos proviene o no de la misma
población.
La prueba H de Kruskal-Wallis es una prueba no paramétrica basada en el rango que puede
utilizarse para corroborar si existen diferencias relevantes a nivel estadístico entre dos o más
grupos de una variable independiente en una variable dependiente ordinal o continua.
La prueba determina si las medianas de dos o más grupos son diferentes. De esta forma,
calcula un estadístico de prueba y lo compara con un punto de corte de la distribución. La
prueba de Kruskal Wallis se considera la alternativa no paramétrica
al ANOVA unidireccional, y una extensión de la prueba U de Mann-Whitney para permitir
la comparación de más de dos grupos independientes.
La prueba H se utiliza cuando no se cumplen los supuestos del ANOVA (como el supuesto
de normalidad). A veces se denomina ANOVA unidireccional sobre rangos, ya que en la
prueba se utilizan los rangos de los valores de los datos en lugar de los puntos de datos reales.
Al ser no paramétrica, la prueba no asume que los datos provienen de una distribución
particular. La prueba de Kruskal Wallis te dirá si hay una diferencia significativa entre los
grupos. Sin embargo, no te dirá qué grupos son diferentes.
Algunas de las ventajas de utilizar los modelos de Kruskal Wallis son:
Puede aplicarse a un gran número de situaciones.
Se puede entender fácilmente de forma intuitiva.
Puede utilizarse con tamaños de muestra más pequeños.
Puede utilizarse con diversos tipos de datos.
24
Necesita menos supuestos o menos estrictos sobre la naturaleza de la distribución de
la población.
Es generalmente robusto y no suele verse afectado por valores extremos en los datos,
como los valores atípicos.
Tiene un alto nivel de eficiencia relativa asintótica en comparación con las pruebas
paramétricas clásicas.
REQUISITOS
Tenemos al menos tres muestras independientes, las cuales se seleccionan al azar
Cada muestra tiene al menos 5 observaciones, si tiene menos de 5 observaciones,
remítase a tablas especiales de valores críticos, como las CRC
No existe el requisito de que las poblaciones tengan una distribución normal o alguna
otra distribución particular
NOTACIÓN
N=número total de observaciones en todas las muestras combinadas
k=número de muestras
R1=suma de los rangos de la muestra 1
n1=número de observaciones de la muestra 1
Para la muestra 2,
la suma de los rangos es R2
el número de observaciones es n2
y se utiliza una notación similar para las otras muestras.
El estadístico de prueba utilizado se denomina estadístico H.
25
Las hipótesis de la prueba son:
H0: las medianas de la población son iguales.
H1: las medianas de la población no son iguales.
PROCEDIMIENTO PARA CALCULAR EL VALOR
DEL ESTADÍSTICO DE PRUEBA H
1. Combinar temporalmente todas las muestras en una muestra grande y asignar un rango a
cada valor muestral. (Ordenar los valores del menor al mayor, y en caso de empates, asignar
a cada observación la media de los rangos implicados).
2. En cada muestra, calcular la suma de los rangos y calcular el tamaño muestral
3. Calcular H utilizando los resultados del paso 2.
26
4.10. APLICACIONES CON EL USO DE
SOFTWARE ESTADÍSTICA
La palabra “Software” se refiere al equipamiento lógico o soporte lógico de un computador
digital, y comprende el conjunto de los componentes lógicos necesarios para hacer posible la
realización de una tarea específica, en contraposición a los componentes físicos del sistema
(hardware).
Tales componentes lógicos incluyen, entre otros, aplicaciones informáticas tales como
procesador de textos, que permite al usuario realizar todas las tareas concernientes a edición
de textos; software de sistema, tal como un sistema operativo, el que, básicamente, permite
al resto de los programas funcionar adecuadamente, facilitando la interacción con los
componentes físicos y el resto de las aplicaciones, también provee una interfaz ante el
usuario. Software es lo que se denomina producto en la Ingeniería de Software.
SOFTWARE ESTADÍSTICO
Un software estadístico es un programa informático que está especialmente diseñado para
resolver problemas en el área de la estadística, o bien está programado para resolver
problemas de esta área.
Existen muchos programas que no son especialmente estadísticos como Excel pero que
pueden hacer algunos cálculos aplicables en estadística, y existen otros que sí lo son ya que
aplican características netamente estadísticas.
Estos programas han impulsado y siguen impulsando enormemente la labor de los
investigadores que desean utilizar la estadística como apoyo en su trabajo.
OBJETIVO
Ejercitar los métodos no paramétricos con ejercicios prácticos utilizando un software
estadístico.
27
OBJETIVOS PARTICULARES
Conocer el software a utilizar para la realización de ejercicio. Utilizar las aplicaciones que
requeridas para resolver ejercicios no paramétricos.
PROCEDIMIENTO
Se utilizará un software estadístico para resolver ejercicios, se trabajará de manera individual
siendo la finalidad el obtener el conocimiento del software y por lo consiguiente los
conceptos de la estadística no paramétrica.
28
REFERENCIAS BIBLIOGRÁFICAS:
[Link]
F
[Link]
[Link]
[Link]
[Link]
0&p=4.4.+Una+muestra%3A+prueba+de+signos.
[Link]
[Link]
[Link]
demanda-usos-aplicaciones-software-estad%C3%ADstico.z1l8ojdq
29