0% encontró este documento útil (0 votos)

540 vistas29 páginas

Unidad 4 Estadistica

Este documento discute diferentes escalas de medición y métodos estadísticos paramétricos vs. no paramétricos. Explora las escalas nominal, ordinal, de intervalo y de razón, y analiza las ventajas y desventajas de los métodos paramétricos y no paramétricos. Luego, introduce varias pruebas estadísticas no paramétricas como la prueba de rachas, la prueba de signos, la prueba de Wilcoxon, la prueba de Mann-Whitney, y la prueba de Kruskal-Wallis.

Cargado por

Chilian Mendoza Ximena

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

540 vistas29 páginas

Unidad 4 Estadistica

Cargado por

Chilian Mendoza Ximena

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

ÍNDICE

4.1- ESCALAS DE MEDICIÓN ..................................................... 3

1. NOMINAL : ....................................................................................................................................................................................3

2. ORDINAL : .....................................................................................................................................................................................4

3. INTERVALO: ..................................................................................................................................................................................5

4. RAZÓN: .........................................................................................................................................................................................6

4.2. MÉTODOS ESTADÍSTICOS PARAMÉTRICOS

CONTRA NO PARAMÉTRICOS ................................................. 8
MÉTODOS PARAMÉTRICOS .....................................................................................................................................................................9

MÉTODOS NO PARAMÉTRICOS ...............................................................................................................................................................9

VENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS ................................................................................................................................10

DESVENTAJAS DE LOS MÉTODOS NO PARAMÉTRICOS ..........................................................................................................................11

¿CÓMO PODRÍAN AFECTAR LOS ANÁLISIS ESTADÍSTICOS?....................................................................................................................11

4.3. PRUEBA DE RACHAS PARA ALEATORIEDAD ........... 13

REQUISITOS ...........................................................................................................................................................................................13

NOTACIÓN .............................................................................................................................................................................................13

4.4. UNA MUESTRA: PRUEBA DE SIGNOS ........................... 15

ESTADÍSTICO DE PRUEBA.......................................................................................................................................................................15

4.5. UNA MUESTRA: PRUEBA DE WILCOXON. .................. 16

EL PROCEDIMIENTO QUE SE UTILIZA: ....................................................................................................................................................16

4.6. DOS MUESTRAS: PRUEBA DE MANN-WHITNEY ....... 17

PROCEDIMIENTO PARA CALCULAR EL VALOR ESTADÍSTICO: .................................................................................................................18

CARACTERÍSTICAS DE LA PRUEBA U DE MANN WHITNEY......................................................................................................................19

4.7. OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS 20

1
4.8. OBSERVACIONES PAREADAS PRUEBA DE
WILCOXON ................................................................................... 22
REQUISITOS ...........................................................................................................................................................................................22

ESTADÍSTICO DE PRUEBA.......................................................................................................................................................................23

VALORES CRÍTICOS ................................................................................................................................................................................23

4.9. VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE

KRAUSKAL-WALLIS .................................................................. 24
REQUISITOS ...........................................................................................................................................................................................25

PROCEDIMIENTO PARA CALCULAR EL VALOR DEL ESTADÍSTICO DE PRUEBA H .....................................................................................26

4.10. APLICACIONES CON EL USO DE SOFTWARE

ESTADÍSTICA ............................................................................... 27
SOFTWARE ESTADÍSTICO .......................................................................................................................................................................27

OBJETIVO ...............................................................................................................................................................................................27

OBJETIVOS PARTICULARES ....................................................................................................................................................................28

PROCEDIMIENTO ...................................................................................................................................................................................28

REFERENCIAS BIBLIOGRÁFICAS: ....................................... 29

2
ESTADÍSTICA NO
PARAMÉTRICA
4.1- ESCALAS DE MEDICIÓN
Para que los datos tengan sentido es necesario compararlos. Y para poder compararlos
debemos utilizar escalas de medición. Dichas escalas tendrán diferentes propiedades en
función de las características de los datos que se compararán. En estadística existen cuatro
escalas de medición: nominal, ordinal, de intervalo y de razón.

TIPO ESCALA OPERATIVIDAD REQUISITO

Mutuamente excluyentes
Nominal Igualdad/desigualdad Exhaustividad

Ordinal Jerarquía mayor/menor Escalonamiento

Intervalos Comparación de intervalos Unidad constante

Razones Cero absoluto

Comparación continua

1. NOMINAL :
Cuando un dato identifica una etiqueta (o el nombre de un atributo) de un elemento, se
considera que la escala de medición es una escala nominal. En esta carecen de sentido el
orden de las etiquetas, así como la comparación y las operaciones aritméticas. La única
finalidad de este tipo de datos es clasificar a las observaciones.

En una escala nominal, la operación consiste en dividir una clase determinada en un conjunto
de subclases mutuamente excluyentes. La única relación envuelta es la de equivalencia,
simbolizada por el signo =, o su ausencia, por el símbolo ≠.

3
Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia.

Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre
los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo
que NO cuenta con un orden lógico.

EJEMPLOS:

 Sexo: 1) masculino; 2) femenino.

 Fumar: 0) no; 1) sí.
 Estado civil: 1, casado; 2, soltero; 3, viudo; 4, divorciado.
 Procedencia del ingreso: 1, urgencias; 2, consultas; 3, otro hospital.

2. ORDINAL :
Cuando los datos muestran las propiedades de los datos nominales, pero además tiene sentido el orden
(o jerarquía) de estos, se utiliza una escala ordinal.

Son variables numéricas cuyos valores representan una categoría o identifican un grupo de
pertenencia contando con un orden lógico.

Este tipo de variables nos permite establecer relaciones de igualdad/desigualdad y a su vez,

podemos identificar si una categoría es mayor o menor que otra.

En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no
es cuantificable o medible.

La diferencia fundamental entre una escala nominal y la ordinal estriba en que ésta incorpora
la relación de “mayor que” (>) o “menor que” (<) a la de equivalencia (=). Cualquier
transformación que no altere el orden de las clases es permisible. La mejor descripción de la
tendencia central es la mediana ya que ésta no se ve afectada por cambios de puntajes, en
tanto no se altere el número de cuentas sobre o bajo ella. Con la escala ordinal es posible usar
todo el rango de pruebas estadísticas conocidas como “estadísticas ordinales o de rango” o
“no paramétricas”. La única presunción de estas pruebas es que los puntajes deben ser
sacados de una distribución continua.

4
EJEMPLOS:

 Clase social: 1) baja, 2) media, 3) alta.

 Grados de reflujo vesicoureteral: grados 1, 2, 3, 4.
 Conformidad con una afirmación: 0) completo desacuerdo, 1) acuerdo parcial, 2)
acuerdo total.
 Fumar: 0) no fumador, 1) fumador leve, <10/día; 2) fumador moderado, 10-20/día, y
3) gran fumador, >20/día).

3. INTERVALO:
En una escala de intervalo, los datos tienen las propiedades de los datos ordinales, pero a su vez la
separación entre las variables tiene sentido. Este tipo de datos siempre es numérico, y el valor cero
no indica la ausencia de la propiedad.

Son variables numéricas cuyos valores representan magnitudes y la distancia entre los
números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de
igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente
entre cada valor de la escala.

Las variables de intervalo carecen de un cero absoluto, por lo que operaciones como la
multiplicación y la división no son realizables.

Las operaciones y relaciones de una escala de intervalo son similares a la estructura de la

aritmética por lo que pueden utilizarse todas las operaciones. En una escala de intervalo se
puede reconocer la equivalencia (=) y el orden (>) y, además, las razones de cada intervalo.
Las pruebas paramétricas pueden y deben usarse si se cumplen las otras presunciones puesto
que las pruebas no paramétricas restan potencia al análisis al no usar toda la información
contenida en una escala de intervalo.

5
4. RAZÓN:
En una escala de razón, los datos tienen todas las propiedades de los datos de intervalo, y la
proporción entre ellos tiene sentido. Para esto se requiere que el valor cero de la escala
indique la ausencia de la propiedad a medir.

Las variables de razón poseen las mismas características de las variables de intervalo, con la
diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia
total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta,
Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables
permiten el nivel más alto de medición. Las variables altura, peso, distancia o el salario, son
algunos ejemplos de este tipo de escala de medida.

El orden de las escalas indica la cantidad relativa de información que contiene cada una de
las ellas. Las mediciones de un nivel de información concreto pueden transformarse o
reescalarse a un nivel inferior, pero no es posible reescalar las variables a un nivel superior
al que se midieron realmente.

La selección de una escala estará determinada por la definición operativa de la variable que
hayamos realizado y por los métodos disponibles para medirla. Para algunas variables solo
existirá un tipo de escala elegible, mientras que para la mayoría tendremos varias alternativas.
En general, siempre que sea posible, interesa utilizar en la recogida de datos la escala más
precisa, aunque no sea la que posteriormente se utilice en el tratamiento estadístico. Ello nos
permitirá adecuar la decisión, una vez conocida la verdadera distribución de nuestros datos.

EJEMPLO:

 Peso: medido en kilogramos.

 Concentración de glucosa en una muestra: medida en mg/dl.
 Tasa de mortalidad: muertes por 1000 personas en riesgo.
 Ingresos: medidos en euros.

6
7
4.2. MÉTODOS ESTADÍSTICOS
PARAMÉTRICOS CONTRA NO
PARAMÉTRICOS

El campo de la estadística existe porque generalmente es imposible recopilar datos de todos

individuos de interés (población). La solución es recopilar datos de un subconjunto (muestra)
de los individuos de interés, pero nuestro verdadero deseo es conocer la verdad sobre la
población. Y para esto es fundamental entender los conceptos Paramétrico y No Paramétrico.

Cantidades como medias, desviaciones estándar y proporciones son todas valores

importantes y se denominan «parámetros» cuando hablamos de una población. Como
generalmente no podemos obtener datos de toda la población, no podemos conocer los
valores de los parámetros para esa población. Sin embargo, podemos calcular estimaciones
de estas cantidades para nuestra muestra. Cuando se calculan a partir de datos de muestra,
estas cantidades son estadísticas. Así, una estadística estima un parámetro.

Hay algunas divisiones de temas en las estadísticas. Una división que rápidamente viene a la
mente es la diferenciación entre estadística descriptiva e inferencial . Hay otras formas en
que podemos separar la disciplina de las estadísticas. Una de estas formas es clasificar los
métodos estadísticos como paramétricos o no paramétricos.

Las pruebas paramétricas tienen requisitos acerca de la naturaleza o forma de las poblaciones
implicadas; las pruebas no paramétricas no requieren que las muestras provengan de
poblaciones con distribuciones normales o con cualquier otro tipo particular de distribución.
En consecuencia, las pruebas de hipótesis no paramétricas suelen llamarse pruebas de
distribución libre.

8
MÉTODOS PARAMÉTRICOS
Incluye estadística descriptiva, modelos estadísticos, inferencia y pruebas estadísticas. La
estructura del modelo de los modelos no paramétricos no se especifica a priori, sino que se
determina a partir de los datos. Esto no implica que tales modelos carecen por completo de
parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están
fijados de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una
distribución de probabilidad.

Los métodos se clasifican según lo que sabemos sobre la población que estamos
estudiando. Los métodos paramétricos suelen ser los primeros métodos que se estudian en
un curso de introducción a la estadística. La idea básica es que hay un conjunto de parámetros
fijos que determinan un modelo de probabilidad.

Los métodos paramétricos son a menudo aquellos para los que sabemos que la población es
aproximadamente normal, o podemos aproximarnos usando una distribución normal después
de invocar el teorema del límite central . Hay dos parámetros para una distribución normal:
la media y la desviación estándar.

MÉTODOS NO PARAMÉTRICOS
Para contrastar con los métodos paramétricos, definiremos métodos no paramétricos. Son
técnicas estadísticas para las que no tenemos que hacer ninguna suposición de parámetros
para la población que estamos estudiando. De hecho, los métodos no tienen ninguna
dependencia de la población de interés.

El conjunto de parámetros ya no es fijo, y tampoco lo es la distribución que utilizamos. Es

por esta razón que los métodos no paramétricos también se denominan métodos sin
distribución.

9
Algunos métodos no paramétricos incluyen:

 Prueba de signos para media poblacional

 Técnicas de arranque
 Prueba U para dos medias independientes
 Prueba de signos de una muestra
 Prueba de los rangos con signo de Wilcoxon
 Prueba U de Mann-Whitney
 Prueba de Kruskal-Wallis
 Prueba de la mediana de Mood
 Prueba de Friedman

VENTAJAS DE LOS MÉTODOS NO

PARAMÉTRICOS
 Los métodos no paramétricos pueden aplicarse a una amplia variedad de situaciones
puesto que no tienen los requisitos más estrictos de los métodos paramétricos
correspondientes. En particular, los métodos no paramétricos no requieren de
poblaciones distribuidas normalmente.

 A diferencia de los métodos paramétricos, los métodos no paramétricos a menudo

pueden aplicarse a datos categóricos, como el género de quienes responden una
encuesta.

 Los métodos no paramétricos, por lo regular, implican cálculos más sencillos que los
métodos paramétricos correspondientes y, por lo tanto, son más fáciles de
comprender y aplicar. (Sin embargo, como la tecnología ha simplificado los cálculos,
es probable que la facilidad de los cálculos no sea un factor tan importante).

10
DESVENTAJAS DE LOS MÉTODOS NO
PARAMÉTRICOS
 Los métodos no paramétricos tienden a desperdiciar información porque los datos
numéricos exactos suelen reducirse a una forma cualitativa. Por ejemplo, en la prueba
del signo no paramétrica las pérdidas de peso de las personas sometidas a una dieta
se registran simplemente como signos negativos; las magnitudes reales de las
pérdidas de peso se ignoran.

 Las pruebas no paramétricas no son tan eficientes como las pruebas paramétricas, de
manera que con una prueba no paramétrica generalmente necesitamos evidencia más
fuerte (como una muestra más grande o diferencias mayores) para rechazar una
hipótesis nula

¿CÓMO PODRÍAN AFECTAR LOS ANÁLISIS

ESTADÍSTICOS?

 Ambas son dos clasificaciones amplias de procedimientos estadísticos.

 Las pruebas paramétricas se basan en suposiciones sobre la distribución
subyacente de la población de la que se tomó la muestra.

11
 Las pruebas no paramétricas no se basan en suposiciones sobre la forma o los
parámetros de la distribución de la población subyacente.
 Si los datos se desvían fuertemente de los supuestos de uno de los procedimientos,
seguir utilizando el mismo podría conducir a conclusiones incorrectas.
 Debemos conocer los supuestos asociados con ambos procedimientos y debemos
aprender métodos para evaluar la validez de esos supuestos.
 Si determinamos que los supuestos de uno de los procedimientos no son válidos,
debemos usar un procedimiento análogo en su lugar.
 El supuesto de normalidad es particularmente útil para una muestra pequeña. Las
pruebas no paramétricas suelen ser una buena opción para estos datos.
 Puede ser difícil decidir si usar uno u otro procedimiento en algunos casos. Los
procedimientos no paramétricos generalmente tienen menos potencia que el
procedimiento paramétrico correspondiente si los datos son realmente normales.
 La interpretación de procedimientos no paramétricos también puede ser más difícil
para los procedimientos paramétricos.

DIFERENCIAS

PARAMÉTRICA NO PARAMÉTRICA
 Asume conocer como se distribuye  Utiliza métodos para conocer la
la variable aleatoria. distribución de un fenómeno
 Parte de la inferencia estadística  Rama de la inferencia estadística
 Fundamentada en distribuciones  Fundamentada en distribuciones no
conocidas conocidas.

12
4.3. PRUEBA DE RACHAS PARA
ALEATORIEDAD
Esta prueba se basa en datos muestrales que tienen dos características y analiza rachas de
esas características para determinar si las rachas parecen ser el resultado de algún proceso
aleatorio, o si las rachas sugieren que el orden de los datos no es aleatorio.

Una racha es una secuencia de datos que tienen la misma característica; la secuencia es
precedida y seguida por datos con una característica diferente o por ningún dato en absoluto.
La prueba de rachas utiliza el número de rachas en una secuencia de datos muestrales para
probar la aleatoriedad del orden de los datos.

El principio fundamental de la prueba de rachas puede establecerse brevemente como sigue:

Rechace la aleatoriedad si el número de rachas es muy bajo o muy alto

REQUISITOS
 Los datos muestrales están acomodados de acuerdo con algún esquema de orden, por
ejemplo, el orden en el que se obtuvieron los valores muestrales.

 Cada valor de los datos se puede categorizar en una de dos categorías separadas
(como hombre/mujer).

NOTACIÓN
 n1=número de elementos en la secuencia que tienen una característica particular (la
característica elegida para n1 es arbitraria).

 n2=número de elementos en la secuencia que tienen la otra característica.

 G=número de rachas Estadístico de Prueba

 Para muestras pequeñas y α = 0.05: Si n1 ≤ 20 y n2 ≤ 20 y el nivel de significancia
es α = 0.05, el estadístico de prueba es el número de rachas G.

13
Los valores críticos se encuentran en la tabla de valores críticos para el número de rachas G.
Rechace la aleatoriedad si el número de rachas G es:

 Menor o igual al valor crítico más pequeño encontrado en dicha tabla

 Mayor o igual al valor crítico más grande encontrado en dicha tabla

 Valores críticos de z, se utiliza la tabla de distribución normal

Datos numéricos: aleatoriedad por arriba o por debajo de la media o de la mediana Se puede
probar la aleatoriedad por la forma como los datos numéricos fluctúan por encima o por
debajo de una media o mediana.

Los economistas utilizan la prueba para detectar aleatoriedad por arriba y por debajo de la
media cuando tratan de identificar tendencias o ciclos.

Un patrón cíclico produciría una secuencia que cambia sistemáticamente, de manera que el
número de rachas tendería a ser grande.

14
4.4. UNA MUESTRA: PRUEBA DE SIGNOS
Consiste en convertir valores de datos en signos positivos y negativos, y luego hacer una
prueba para ver si hay una cantidad desproporcionadamente mayor de uno u otro signo.

Es una prueba no paramétrica (de distribución libre) que utiliza signos positivos y negativos
para probar diferentes aseveraciones, incluyendo:

 Aseveraciones que implican datos muestrales apareados.

 Aseveraciones que implican datos nominales.
 Aseveraciones acerca de la mediana de una sola población

La idea básica que subyace en la prueba del signo es el análisis de las frecuencias de los
signos positivos y negativos para determinar si son significativamente diferentes.

REQUISITOS
 Los datos muestrales se seleccionaron aleatoriamente.

 No existe el requisito de que los datos muestrales provengan de una población con
una distribución particular, como una distribución normal.

NOTACIÓN
 x= el número de veces que ocurre el signo menos frecuente
 n= el número total de signos positivos y negativos combinados

ESTADÍSTICO DE PRUEBA
Cuando se aplica la prueba del signo en una prueba de una cola, necesitamos ser muy
cuidadosos para evitar obtener la conclusión equivocada cuando un signo ocurre
significativamente con más frecuencia que el otro, pero los datos muestrales contradicen la
hipótesis alternativa.

15
4.5. UNA MUESTRA: PRUEBA DE WILCOXON.
La prueba de Wilcoxon es una prueba estadísticamente asimétrica, que puede referirse a la
prueba de Suma de rango o la versión de prueba de Firma de rango, que compara dos grupos
emparejados. Las pruebas básicamente calculan la diferencia entre conjuntos de pares y
analizan estas diferencias para ver si son estadísticamente diferentes entre sí.

Esta prueba puede utilizarse para probar la aseveración de que una muestra proviene de una
población con una mediana específica.

EL PROCEDIMIENTO QUE SE UTILIZA:

1. Para cada dato calcule las diferencias restando el valor de la mediana hipotética de cada
valor.

2. Ignorar los signos de las diferencias, luego acomodar las diferencias de la menor a la mayor
y reemplazarlas por el valor del rango correspondiente. Cuando las diferencias tengan el
mismo valor numérico, asignar la media de los rangos implicados en el empate.

3. Agregar a cada rango el signo de la diferencia de la que provino.

4. Calcular la suma de los valores absolutos de los rangos negativos. También calcular la
suma de los rangos positivos.

5. Permitir que T sea la más pequeña de las dos sumas calculadas en el paso anterior.

6. Permitir que n sea el número de pares de datos para los que la diferencia no es 0

7. Determinar el estadístico de prueba y los valores críticos con base en el tamaño muestral.

8. Cuando se obtenga la conclusión, rechazar la hipótesis nula si los datos muestrales le

llevan a un estadístico de prueba que se ubica en la región crítica, esto es, cuando el
estadístico de prueba sea menor o igual que el valor crítico (s). De otra forma no rechazar la
hipótesis nula.

16
4.6. DOS MUESTRAS: PRUEBA DE MANN-
WHITNEY
La prueba de la suma de rangos de Wilcoxon es una prueba no paramétrica que utiliza rangos
de datos muestrales de dos poblaciones independientes.

Se aplica para la comparación de dos muestras independientes cuando las mismas tienen
pocos datos o no siguen una distribución normal. De esta manera, se considera que es una
prueba no paramétrica, a diferencia de su homóloga la prueba t de Student, que se usa
cuando la muestra es suficientemente grande y sigue la distribución normal.

La hipótesis alternativa es la aseveración de que las dos poblaciones tienen medianas

diferentes

 Ho: Las dos muestras provienen de poblaciones con medianas iguales

 H1: Las dos muestras provienen de poblaciones con medianas diferentes

REQUISITOS
 Hay dos muestras independientes de datos seleccionados al azar.
 Cada una de las muestras tienen más de 10 valores.
 No existe el requisito de que las dos poblaciones tengan una distribución normal o
cualquier otra distribución particular.

NOTACIÓN
 n1=tamaño de la muestra 1
 n2=tamaño de la muestra 2
 R1=suma de rangos de la muestra 1
 R2=suma de rangos de la muestra 2
 R=lo mismo que R1
 μR=media de los valores muestrales R que se espera cuando las dos poblaciones
tienen medianas iguales

17
 σR=desviación estándar de los valores muestrales R que se espera cuando las dos
poblaciones tienen medianas iguales

 n2= tamaño de la otra muestra R=suma de rangos de la muestra con tamaño

 n1 Valores críticos. Los valores críticos pueden encontrarse en la tabla de distribución
normal.

PROCEDIMIENTO PARA CALCULAR EL VALOR

ESTADÍSTICO:
1. Combinar temporalmente las dos muestras en una muestra grande, entonces reemplazar
cada valor muestral por su rango. Si los valores están empatados, asignarle la media de los
rangos implicados en el empate.

2. Consultar la suma de los rangos de las dos muestras.

3. Calcular el valor del estadístico de prueba z.

18
CARACTERÍSTICAS DE LA PRUEBA U DE MANN
WHITNEY
La prueba U de Mann – Whitney un test no-paramétrico, aplicable a muestras que no siguen
la distribución normal o con pocos datos. Tiene las siguientes características:

 Compara las medianas.

 Funciona sobre rangos ordenados.

 Es menos potente, entendiéndose por potencia la probabilidad de rechazar la

hipótesis nula cuando en realidad es falsa.

Tomando en cuenta estas características, la prueba U de Mann – Whitney se aplica cuando:

 Los datos son independientes.

 No siguen la distribución normal.

 La hipótesis nula H0 se acepta si las medianas de las dos muestras coinciden: Ma =

 Se acepta la hipótesis alternativa H1 si las medianas de las dos muestras difieren: Ma

≠ Mb

19
4.7. OBSERVACIONES PAREADAS: PRUEBA
DE SIGNOS
La prueba de signos es un método estadístico para probar diferencias consistentes entre pares
de observaciones, como el peso de los sujetos antes y después del tratamiento.

Los pares de observaciones pueden ser designados x y y .

Para comparaciones de observaciones emparejadas ( x , y), la prueba de signo es más útil si
las comparaciones solo se pueden expresar como x > y , x = y , o x < y .
Si, en cambio, las observaciones se pueden expresar como cantidades numéricas ( x = 7, y =
18), o como rangos (rango de x = 1er, rango de y = 8vo), entonces la prueba t pareada [1] o
el Prueba de rango con signo de Wilcoxon [2] generalmente tendrá mayor poder que la
prueba de signos para detectar diferencias consistentes.

Si X e Y son variables cuantitativas, la prueba de signo puede usarse para probar la

hipótesis de que la diferencia entre X e Y tiene una mediana cero, asumiendo distribuciones
continuas de las dos variables aleatorias X e Y , en la situación en la que podemos
dibujar pares muestras de X y y .

Consiste en convertir valores de datos en signos positivos y negativos, y luego hacer una
prueba para ver si hay una cantidad desproporcionadamente mayor de uno u otro signo.

Es una prueba no paramétrica (de distribución libre) que utiliza signos positivos y negativos
para probar diferentes aseveraciones, incluyendo:

 Aseveraciones que implican datos muestrales apareados.

 Aseveraciones que implican datos nominales.
 Aseveraciones acerca de la mediana de una sola población. La idea básica que
subyace en la prueba del signo es el análisis de las frecuencias de los signos positivos
y negativos para determinar si son significativamente diferentes.

20
REQUISITOS
 Los datos muestrales se seleccionaron aleatoriamente.

 No existe el requisito de que los datos muestrales provengan de una población con
una distribución particular, como una distribución normal.

NOTACIÓN
 x= el número de veces que ocurre el signo menos frecuente n= el número total de
signos positivos y negativos combinados

Cuando se aplica la prueba del signo en una prueba de una cola, necesitamos ser muy
cuidadosos para evitar obtener la conclusión equivocada cuando un signo ocurre
significativamente con más frecuencia que el otro, pero los datos muestrales contradicen la
hipótesis alternativa.

Cuando se utiliza la prueba del signo con datos que están ordenados en pares, convertimos
los datos en bruto a datos con signos positivos y negativos como sigue:

1. Restamos cada valor de la segunda variable del valor correspondiente de la primera

variable

2. Registramos sólo el signo de la diferencia encontrada por el paso 1. Excluimos los

empates: es decir, excluimos todos los datos apareados en los que ambos valores son iguales

21
4.8. OBSERVACIONES PAREADAS PRUEBA
DE WILCOXON
Esta prueba puede utilizarse para probar la aseveración de que una muestra l proviene de una
población con una mediana específica.

El procedimiento que se utiliza:

1. Para par de datos, calcular la diferencia d restando el segundo valor del primero. Mantener
los signos, pero descartar cualquier par para el que d=0

2. Ignorar los signos de las diferencias, luego acomodar las diferencias de la menor a la mayor
y reemplácelas por el valor del rango correspondiente. Cuando las diferencias tengan el
mismo valor numérico, asignarles la media de los rangos implicados en el empate.

3. Agregar a cada rango el signo de la diferencia de la que provino.

4. Calcular la suma de los valores absolutos de los rangos negativos. También calcular la
suma de los rangos positivos.

5. Permitir que T sea la más pequeña de las dos sumas calculadas en el paso anterior.

6. Permitir que n sea el número de pares de datos para los que la diferencia no es 0

7. Determinar el estadístico de prueba y los valores críticos con base en el tamaño muestral.

8. Cuando se plantee la conclusión, rechazar la hipótesis nula si los datos muestrales llevan
a un estadístico de prueba que se ubica en la región crítica, esto es, cuando el estadístico de
prueba sea menor o igual que el valor crítico (s). De otra forma no rechazar la hipótesis nula.

REQUISITOS
 Los datos consisten en datos apareados que se seleccionaron aleatoriamente.
 La población de las diferencias (calculadas a partir de los pares de datos) tiene una
distribución que es aproximadamente simétrica, lo que quiere decir que la mitad
izquierda de su histograma es aproximadamente una imagen de espejo de la mitad
derecha. (No existe el requisito de que los datos tengan una distribución normal).

22
NOTACIÓN
 T = la más pequeña de las siguientes sumas:

1. La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean
cero

2. La suma de los rangos positivos de las diferencias d que no sean cero.

ESTADÍSTICO DE PRUEBA
Si n ≤ 30, el valor crítico T se encuentra en la tabla de valores críticos de T para la prueba de
rangos con signo Wilcoxon.

VALORES CRÍTICOS
 Si n ≤ 30, el valor crítico T se encuentra en la tabla de valores críticos de T para la
prueba de rangos con signo de Wilcoxon

 Si n > 30, los valores críticos z se encuentra en la tabla de distribución normal

23
4.9. VARIAS MUESTRAS INDEPENDIENTES:
PRUEBA DE KRAUSKAL-WALLIS

La prueba de Kruskal Wallis toma su nombre de William Kruskal y W. Allen Wallis y se

utiliza en la estadística para corroborar si un conjunto de datos proviene o no de la misma
población.

La prueba H de Kruskal-Wallis es una prueba no paramétrica basada en el rango que puede

utilizarse para corroborar si existen diferencias relevantes a nivel estadístico entre dos o más
grupos de una variable independiente en una variable dependiente ordinal o continua.

La prueba determina si las medianas de dos o más grupos son diferentes. De esta forma,
calcula un estadístico de prueba y lo compara con un punto de corte de la distribución. La
prueba de Kruskal Wallis se considera la alternativa no paramétrica
al ANOVA unidireccional, y una extensión de la prueba U de Mann-Whitney para permitir
la comparación de más de dos grupos independientes.

La prueba H se utiliza cuando no se cumplen los supuestos del ANOVA (como el supuesto
de normalidad). A veces se denomina ANOVA unidireccional sobre rangos, ya que en la
prueba se utilizan los rangos de los valores de los datos en lugar de los puntos de datos reales.

Al ser no paramétrica, la prueba no asume que los datos provienen de una distribución
particular. La prueba de Kruskal Wallis te dirá si hay una diferencia significativa entre los
grupos. Sin embargo, no te dirá qué grupos son diferentes.

Algunas de las ventajas de utilizar los modelos de Kruskal Wallis son:

 Puede aplicarse a un gran número de situaciones.

 Se puede entender fácilmente de forma intuitiva.
 Puede utilizarse con tamaños de muestra más pequeños.
 Puede utilizarse con diversos tipos de datos.

24
 Necesita menos supuestos o menos estrictos sobre la naturaleza de la distribución de
la población.
 Es generalmente robusto y no suele verse afectado por valores extremos en los datos,
como los valores atípicos.
 Tiene un alto nivel de eficiencia relativa asintótica en comparación con las pruebas
paramétricas clásicas.

REQUISITOS
 Tenemos al menos tres muestras independientes, las cuales se seleccionan al azar
 Cada muestra tiene al menos 5 observaciones, si tiene menos de 5 observaciones,
remítase a tablas especiales de valores críticos, como las CRC
 No existe el requisito de que las poblaciones tengan una distribución normal o alguna
otra distribución particular

NOTACIÓN
 N=número total de observaciones en todas las muestras combinadas
 k=número de muestras
 R1=suma de los rangos de la muestra 1
 n1=número de observaciones de la muestra 1

Para la muestra 2,

 la suma de los rangos es R2

 el número de observaciones es n2

y se utiliza una notación similar para las otras muestras.

El estadístico de prueba utilizado se denomina estadístico H.

25
Las hipótesis de la prueba son:

 H0: las medianas de la población son iguales.

 H1: las medianas de la población no son iguales.

PROCEDIMIENTO PARA CALCULAR EL VALOR

DEL ESTADÍSTICO DE PRUEBA H
1. Combinar temporalmente todas las muestras en una muestra grande y asignar un rango a
cada valor muestral. (Ordenar los valores del menor al mayor, y en caso de empates, asignar
a cada observación la media de los rangos implicados).

2. En cada muestra, calcular la suma de los rangos y calcular el tamaño muestral

3. Calcular H utilizando los resultados del paso 2.

26
4.10. APLICACIONES CON EL USO DE
SOFTWARE ESTADÍSTICA

La palabra “Software” se refiere al equipamiento lógico o soporte lógico de un computador

digital, y comprende el conjunto de los componentes lógicos necesarios para hacer posible la
realización de una tarea específica, en contraposición a los componentes físicos del sistema
(hardware).

Tales componentes lógicos incluyen, entre otros, aplicaciones informáticas tales como
procesador de textos, que permite al usuario realizar todas las tareas concernientes a edición
de textos; software de sistema, tal como un sistema operativo, el que, básicamente, permite
al resto de los programas funcionar adecuadamente, facilitando la interacción con los
componentes físicos y el resto de las aplicaciones, también provee una interfaz ante el
usuario. Software es lo que se denomina producto en la Ingeniería de Software.

SOFTWARE ESTADÍSTICO
Un software estadístico es un programa informático que está especialmente diseñado para
resolver problemas en el área de la estadística, o bien está programado para resolver
problemas de esta área.

Existen muchos programas que no son especialmente estadísticos como Excel pero que
pueden hacer algunos cálculos aplicables en estadística, y existen otros que sí lo son ya que
aplican características netamente estadísticas.

Estos programas han impulsado y siguen impulsando enormemente la labor de los

investigadores que desean utilizar la estadística como apoyo en su trabajo.

OBJETIVO
Ejercitar los métodos no paramétricos con ejercicios prácticos utilizando un software
estadístico.

27
OBJETIVOS PARTICULARES
Conocer el software a utilizar para la realización de ejercicio. Utilizar las aplicaciones que
requeridas para resolver ejercicios no paramétricos.

PROCEDIMIENTO
Se utilizará un software estadístico para resolver ejercicios, se trabajará de manera individual
siendo la finalidad el obtener el conocimiento del software y por lo consiguiente los
conceptos de la estadística no paramétrica.

28
REFERENCIAS BIBLIOGRÁFICAS:

 [Link]
F
 [Link]
 [Link]
 [Link]
 [Link]
0&p=4.4.+Una+muestra%3A+prueba+de+signos.
 [Link]
 [Link]
 [Link]
demanda-usos-aplicaciones-software-estad%C3%ADstico.z1l8ojdq

También podría gustarte

Antologia Unidad 1 Estadistica Inferencial
Aún no hay calificaciones
Antologia Unidad 1 Estadistica Inferencial
59 páginas
Inferencia Estadística: Estimación y Confianza
100% (5)
Inferencia Estadística: Estimación y Confianza
18 páginas
Unidad 1 Distribuciones de Frecuencia
83% (6)
Unidad 1 Distribuciones de Frecuencia
12 páginas
Introducción a la Inferencia Estadística
Aún no hay calificaciones
Introducción a la Inferencia Estadística
5 páginas
Medidas de Tendencia Central: Guía
Aún no hay calificaciones
Medidas de Tendencia Central: Guía
5 páginas
2.7 Intervalos de Confianza para Proporciones - Dr. Jose A. Sarricolea Valencia
Aún no hay calificaciones
2.7 Intervalos de Confianza para Proporciones - Dr. Jose A. Sarricolea Valencia
4 páginas
Análisis de Regresión Lineal y Múltiple
Aún no hay calificaciones
Análisis de Regresión Lineal y Múltiple
48 páginas
4 3 Registros Electronicos
Aún no hay calificaciones
4 3 Registros Electronicos
9 páginas
Análisis de Tendencias No Lineales en Importaciones
50% (2)
Análisis de Tendencias No Lineales en Importaciones
14 páginas
Métodos para la Identificación de Problemas
Aún no hay calificaciones
Métodos para la Identificación de Problemas
11 páginas
Análisis de Series de Tiempo en Estadística
Aún no hay calificaciones
Análisis de Series de Tiempo en Estadística
21 páginas
Distribuciones muestrales y sus medidas
0% (1)
Distribuciones muestrales y sus medidas
2 páginas
Act 1. Cuadro Comparativo
Aún no hay calificaciones
Act 1. Cuadro Comparativo
5 páginas
1.4 Rosas Martinez Frida Vanessa
Aún no hay calificaciones
1.4 Rosas Martinez Frida Vanessa
6 páginas
2.9 Intervalos de Confianza para Varianzas - Dr. Jose A. Sarricolea Valencia
Aún no hay calificaciones
2.9 Intervalos de Confianza para Varianzas - Dr. Jose A. Sarricolea Valencia
6 páginas
1.4 - ESTADÍSTICA INFERENCIAL - Dr. Jose A. Sarricolea Valencia
Aún no hay calificaciones
1.4 - ESTADÍSTICA INFERENCIAL - Dr. Jose A. Sarricolea Valencia
25 páginas
4.1. Introducción, Conceptualización, Importancia y Alcances Del Diseño Experimental en El Ámbito Empresarial.
Aún no hay calificaciones
4.1. Introducción, Conceptualización, Importancia y Alcances Del Diseño Experimental en El Ámbito Empresarial.
8 páginas
Índice de Variación Estacional
Aún no hay calificaciones
Índice de Variación Estacional
6 páginas
Evaluación y Pruebas de Hipótesis en Estadística
Aún no hay calificaciones
Evaluación y Pruebas de Hipótesis en Estadística
199 páginas
Métodos de Series de Tiempo
Aún no hay calificaciones
Métodos de Series de Tiempo
1 página
Estadística No Paramétrica: Métodos y Pruebas
Aún no hay calificaciones
Estadística No Paramétrica: Métodos y Pruebas
49 páginas
1.2 Concepto de Estadística
Aún no hay calificaciones
1.2 Concepto de Estadística
2 páginas
6.-Cuadro Sinoptico (Evolucion de Las Tic) - Word
Aún no hay calificaciones
6.-Cuadro Sinoptico (Evolucion de Las Tic) - Word
1 página
Metodología de Pruebas de Hipótesis
100% (1)
Metodología de Pruebas de Hipótesis
16 páginas
Ensayo "La Utilización Del Punto de Equilibrio en Una Organización".
100% (1)
Ensayo "La Utilización Del Punto de Equilibrio en Una Organización".
4 páginas
Guía de Investigación Estadística
0% (1)
Guía de Investigación Estadística
2 páginas
Analisis Residual
0% (2)
Analisis Residual
3 páginas
Aplicaciones médicas de Navier-Stokes
Aún no hay calificaciones
Aplicaciones médicas de Navier-Stokes
7 páginas
Importancia del Estudio de Tiempos y Movimientos
Aún no hay calificaciones
Importancia del Estudio de Tiempos y Movimientos
3 páginas
Tipos de Estimaciones y Caracteristicas
Aún no hay calificaciones
Tipos de Estimaciones y Caracteristicas
12 páginas
Teoría de Decisiones en Ingeniería Industrial
Aún no hay calificaciones
Teoría de Decisiones en Ingeniería Industrial
31 páginas
Pruebas de Hipótesis en Estadística
Aún no hay calificaciones
Pruebas de Hipótesis en Estadística
19 páginas
Problemario de Estadística Descriptiva
Aún no hay calificaciones
Problemario de Estadística Descriptiva
16 páginas
2.3 Estimación Puntual - Dr. Jose A. Sarricolea Valencia
Aún no hay calificaciones
2.3 Estimación Puntual - Dr. Jose A. Sarricolea Valencia
10 páginas
Conceptos Clave del Apalancamiento Financiero
100% (2)
Conceptos Clave del Apalancamiento Financiero
8 páginas
Megatendencias de La Mercadotecnia
Aún no hay calificaciones
Megatendencias de La Mercadotecnia
6 páginas
1.1.5 Ecua Valor
Aún no hay calificaciones
1.1.5 Ecua Valor
2 páginas
Glosario de Pronósticos y Series de Tiempo
0% (1)
Glosario de Pronósticos y Series de Tiempo
8 páginas
Pruebas de Hipótesis en Estadística
100% (1)
Pruebas de Hipótesis en Estadística
34 páginas
Diseño Experimental para Un Factor
Aún no hay calificaciones
Diseño Experimental para Un Factor
2 páginas
Derecho Internacional, Registro de Propiedad y Normas Oficiales
Aún no hay calificaciones
Derecho Internacional, Registro de Propiedad y Normas Oficiales
9 páginas
2.6 Teorema de Bayes
Aún no hay calificaciones
2.6 Teorema de Bayes
3 páginas
Pruebas de Hipótesis con una Muestra
80% (5)
Pruebas de Hipótesis con una Muestra
15 páginas
Prueba de Hipótesis y Estadística Muestral
Aún no hay calificaciones
Prueba de Hipótesis y Estadística Muestral
18 páginas
Intervalos de Confianza y Estadística
Aún no hay calificaciones
Intervalos de Confianza y Estadística
7 páginas
Determinación de La Ecuación de Regresión
Aún no hay calificaciones
Determinación de La Ecuación de Regresión
20 páginas
Prueba de Corridas para Aleatoriedad
0% (1)
Prueba de Corridas para Aleatoriedad
3 páginas
5.2 y 5.3 Investigación de Operaciones
Aún no hay calificaciones
5.2 y 5.3 Investigación de Operaciones
27 páginas
Teorema de Moivre y Números Complejos
0% (1)
Teorema de Moivre y Números Complejos
7 páginas
1.1.2 Tasa de Interes Lider, Tiie, CCP, Cetes
Aún no hay calificaciones
1.1.2 Tasa de Interes Lider, Tiie, CCP, Cetes
17 páginas
Unidad 4 Canul
Aún no hay calificaciones
Unidad 4 Canul
10 páginas
Componentes de la Investigación Estadística
Aún no hay calificaciones
Componentes de la Investigación Estadística
4 páginas
Estadistica Unidad 3 y 4
Aún no hay calificaciones
Estadistica Unidad 3 y 4
64 páginas
Mapa Conceptual...
Aún no hay calificaciones
Mapa Conceptual...
2 páginas
Mapa Mental Importancia Del Empleo de Bloques
Aún no hay calificaciones
Mapa Mental Importancia Del Empleo de Bloques
1 página
Proyecto Pecina
Aún no hay calificaciones
Proyecto Pecina
25 páginas
Pruebas No Paramétricas en Estadística
Aún no hay calificaciones
Pruebas No Paramétricas en Estadística
4 páginas
Tipos y Métodos de Escalas de Medición
Aún no hay calificaciones
Tipos y Métodos de Escalas de Medición
8 páginas
Introducción a la Estadística No Paramétrica
Aún no hay calificaciones
Introducción a la Estadística No Paramétrica
5 páginas
Pruebas de Bondad de Ajuste en Estadística
Aún no hay calificaciones
Pruebas de Bondad de Ajuste en Estadística
14 páginas
Simulación y Teoría de Colas en IO
Aún no hay calificaciones
Simulación y Teoría de Colas en IO
8 páginas
Ulises Moreno@espoch Edu Ec
Aún no hay calificaciones
Ulises Moreno@espoch Edu Ec
12 páginas
Prueba de Hipótesis No Paramétrica
Aún no hay calificaciones
Prueba de Hipótesis No Paramétrica
21 páginas
Ejercicio de Regresión Lineal Simple
Aún no hay calificaciones
Ejercicio de Regresión Lineal Simple
4 páginas
Prueba de Hipótesis en Análisis Cuantitativo
Aún no hay calificaciones
Prueba de Hipótesis en Análisis Cuantitativo
9 páginas
Distribucion Muestral de La Proporcion
100% (1)
Distribucion Muestral de La Proporcion
9 páginas
Caso Practico Und 1 Estadistica Inferencial
Aún no hay calificaciones
Caso Practico Und 1 Estadistica Inferencial
4 páginas
Regresión Lineal Simple en Estadística
Aún no hay calificaciones
Regresión Lineal Simple en Estadística
21 páginas
Probabilidades y Experimentos Aleatorios
Aún no hay calificaciones
Probabilidades y Experimentos Aleatorios
4 páginas
Pruebas de Hipótesis con SPSS
Aún no hay calificaciones
Pruebas de Hipótesis con SPSS
59 páginas
Métodos de Comprobación de Hipótesis
Aún no hay calificaciones
Métodos de Comprobación de Hipótesis
17 páginas
Análisis de Prueba T en Actitudes Militares
Aún no hay calificaciones
Análisis de Prueba T en Actitudes Militares
39 páginas
Diseño Experimental en Producción Lechera
Aún no hay calificaciones
Diseño Experimental en Producción Lechera
12 páginas
Juan Francisco Padron Castro
Aún no hay calificaciones
Juan Francisco Padron Castro
8 páginas
Relación entre Ingeniería y Estadística
Aún no hay calificaciones
Relación entre Ingeniería y Estadística
34 páginas
Muestreo Estratificado en Estadística
100% (1)
Muestreo Estratificado en Estadística
6 páginas
Análisis de regresión y estadísticas avanzadas
Aún no hay calificaciones
Análisis de regresión y estadísticas avanzadas
12 páginas
Probabilidades en Estadística II
Aún no hay calificaciones
Probabilidades en Estadística II
3 páginas
Fundamentos de Calidad y Estadística
Aún no hay calificaciones
Fundamentos de Calidad y Estadística
57 páginas
Análisis de Peso en Ejercicios: Pruebas No Paramétricas
Aún no hay calificaciones
Análisis de Peso en Ejercicios: Pruebas No Paramétricas
3 páginas
Análisis de Datos en Probabilidad y Estadística
Aún no hay calificaciones
Análisis de Datos en Probabilidad y Estadística
6 páginas
Método Dykstra-Parsons en Yacimientos
Aún no hay calificaciones
Método Dykstra-Parsons en Yacimientos
7 páginas
Prueba de Hipótesis sobre Nicotina
Aún no hay calificaciones
Prueba de Hipótesis sobre Nicotina
8 páginas
Probabilidades en Gasolineras y Producción
Aún no hay calificaciones
Probabilidades en Gasolineras y Producción
13 páginas
Ejercicios de Estadística Educativa
Aún no hay calificaciones
Ejercicios de Estadística Educativa
4 páginas
Cálculo de Tamaños de Muestra en Estadística
Aún no hay calificaciones
Cálculo de Tamaños de Muestra en Estadística
4 páginas
Diseño Cuadrado Latino
Aún no hay calificaciones
Diseño Cuadrado Latino
12 páginas
Sesión Integradora 4
Aún no hay calificaciones
Sesión Integradora 4
5 páginas
Introduccion A La Probabilidad
Aún no hay calificaciones
Introduccion A La Probabilidad
5 páginas