INTRODUCCIÓN
Después de la segunda guerra mundial se afianzó más la industria y la parte
comercial, siendo necesario renovar la producción para suplir las necesidades de la
época, surgiendo contribuciones a los fundamentos estadísticos de las teorías de las
probabilidades. El nacimiento de la Estadística se ubica a mediados del siglo XVII,
un ciudadano común llamado Juan Graunt nacido en Londres que era comerciante
organizó estos datos en la forma que hoy llamamos Estadística Descriptiva, la cual
fue publicada como “Observaciones Naturales y Políticas hechas sobre la tasa de
Mortalidad”.
El nacimiento de la probabilidad tiene una historia mucho más antigua. Se
origina a través del estudio de juegos de azar y apuestas durante el siglo XVI. La
teoría de la probabilidad, fue una rama de los estudios matemáticos hechos por Blaise
Pascal y Pierre de Fermat en el siglo XVII. Actualmente en el siglo XXI, el modelo
probabilístico se utiliza para controlar el flujo del tráfico a través de autopistas, en
una conexión telefónica, o en una computadora, encontrar la composición genética de
individuos o poblaciones, control de calidad, seguro, inversión y otros sectores de
negocios y de la industria.
Las buenas decisiones de hoy en día son conducidas por datos. En todos los
aspectos de nuestras vidas, y más a en el mundo de los de los negocios, una
diversidad asombrosa de datos está disponible para el reconocimiento y la
aproximación analítica. Actualmente, gerentes de negocios y profesionales son más
exigidos a justificar sus decisiones basándose en la información proporcionada por
datos y necesitan sistemas de soporte de decisiones basadas en modelos.
El estadístico Ronald Fisher describe los diferentes métodos estadísticos, entre
esos se encuentran Las Pruebas de Chi Cuadrado, llegando a formar parte de la
Estadística Aplicada actualmente y la técnica que ha desarrollado la escuela
cuantitativa; contribuyendo de manera importante a la aplicación en el área gerencial
o administrativa, para que el Gerente o Administrador enfrente la incertidumbre
aplicando un estudio cuantitativo que sea realista.
Esta habilidad Estadística como entre otras, le permitirá recolectar, analizar e
interpretar inteligentemente los datos relevantes en su toma de decisión, solucionar
problemas en una diversidad de contextos, agregar soporte a las decisiones y reducir
el trabajo de adivinar, es aquí donde se basa la importancia de la Teoría de la
Probabilidad en la toma de decisiones.
Tomando en cuenta que la toma de decisiones, es el proceso de selección de
una alternativa, entre un conjunto de dos o más de éstas; permitiendo conocer el
riesgo de cada alternativa, ya que las buenas decisiones son producto de la buena y
oportuna información.
1.1 Planteamiento Del Problema
Mediante el Análisis de las Aplicaciones de la Distribución de las
Probabilidades del Chi Cuadrado, se puede conocer la importancia del método, así
como los beneficios que tiene esta aplicación en la toma de decisiones para las
organizaciones en general. En la actualidad cada vez es mayor la incertidumbre en la
que viven los gerentes, debido tanto a los factores externos e internos que afectan la
toma de decisiones de los mismos.
Existen dos formas de abordar el asunto de la toma de decisiones. La primera
forma es estudiar la manera como las personas suelen tomar decisiones y la otra de
cómo deberían tomarla. La primera, se basa en realizar ciertos tipos de experimentos
con los que se tratan de encontrar algún patrón de comportamiento y, en este caso
estamos frente a un enfoque descriptivo de la toma de decisiones. En el otro caso,
consiste en elaborar un conjunto de supuestos, viéndose este como la prueba de
hipótesis y con éstos se dan pautas de como debe ser la conducta de aquel que toma
la decisión siempre considerando que es un ser racional e intencional, aunque tenga
limitaciones de información.
La distribución Chi-Cuadrado tiene muchas aplicaciones en inferencia
estadística, por ejemplo en el test Chi-Cuadrado y en la estimación de varianzas.
También está involucrada en el problema de estimar la media de una población
normalmente distribuida y en el problema de estimar la pendiente de una recta de
regresión lineal, a través de su papel en la distribución t de Student, y participa en
todos los problemas de análisis de varianza, por su papel en la distribución F de
Snedecor, que es la distribución del cociente de dos variables aleatorias de
distribución Chi-Cuadrado e independientes.
Las pruebas de hipótesis aplicables a los niveles de medición nominal u ordinal
se denominan Pruebas No Paramétricas o libres de distribución, donde esta última
denominación implica que en tales pruebas no intervienen suposiciones con respecto
a la distribución de la población de origen, considerándose así las distribuciones del
Chi Cuadrado como una prueba no paramétrica que mide la discrepancia entre una
distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las
diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de
hipótesis. También se utiliza para probar la independencia de dos variables entre sí,
mediante la presentación de los datos en tablas de contingencia.
En Estadística, la distribución Chi Cuadrado, también denominada Chi-
Cuadrado de Pearson, es una distribución de probabilidad continua con un parámetro
k, que representa los grados de libertad de la variable aleatoria.
En esta investigación haremos énfasis en la prueba de Chi Cuadrado de
Pearson, la cual es una prueba no paramétrica, muy utilizada para la toma de
decisiones. Esta prueba nos permite determinar si el comportamiento de las categorías
de una variable presenta diferencias estadísticamente significativas. En el caso de la
Prueba de Independencia, debemos partir de la teoría que no existe relación entre las
variables de la tabla de contingencia (Hipótesis nula); es decir, debemos asumir que
los resultados de las categorías de una variable no se ven afectados o influenciados
por las categorías de la segunda variable.
El cálculo del Chi Cuadrado, arroja como resultado un valor numérico
denominado alfa (α), el cual debe ser comparado con el Nivel de Significancia
elegido, es decir, el valor que indica el porcentaje de valores de muestra que están
fuera de ciertos limites; suponiendo que la hipótesis nula es correcta, es decir, se trata
de la probabilidad de rechazar la hipótesis nula cuando es cierta, estos porcentajes
pueden ser 1%, 5% entre otros, así mismo los grados de libertad pueden ser varios y
dependen del número de valores de la muestra.
Esta investigación es un estudio de varias cuestiones en relación con variables
cualitativas ó cuantitativas cuyos datos están recogidos en forma de tabla de
frecuencias. El denominador común a todas ellas, es que su tratamiento estadístico
está basado en la misma distribución teórica: la distribución X² (Chi-cuadrado)
1.2 Objetivos De La Investigación
1.2.1 Objetivo General
Analizar la Distribución de las Probabilidades del Chi Cuadrado, como
herramienta para la Toma de Decisiones.
1.2.2 Objetivos Específicos
Describir los aspectos generales de la distribución del Chi Cuadrado.
Describir cada una de las aplicaciones de la distribución de probabilidades de Chi
cuadrado en la toma de decisiones.
Identificar las pruebas de la distribución del Chi Cuadrado más utilizadas.
Comparar las diferencias que existen entre las Pruebas de Chi Cuadrado.
Explicar a través de ejemplos prácticos las aplicaciones de la distribución de las
pruebas del Chi Cuadrado.
1.3 Justificación
Los procesos de información gerencial para una empresa, juegan un papel muy
importante en la competitividad de la misma. Para una empresa, mantenerse en una
posición privilegiada y sostenible contra las fuerzas del entorno que la rodea, sólo es
posible si cuenta con un sistema de información relevante, oportuna y confiable, estos
beneficios son posibles a través de las herramientas estadísticas.
Las Aplicaciones de la Distribución de la Probabilidades de Chi Cuadrado,
permite observar la importancia de esta herramienta; que hoy en día es utilizada o
aplicada a nivel gerencial, para procesar datos a fin de establecer una planeación
efectiva, la elección entre cursos de acción alternativos y como un mecanismo de
control, también sirve o es un medio de mucha ayuda para obtener información
necesaria para el uso de una gerencia, es decir, la información obtenida o resultado de
Chi Cuadrado, permite resolver situaciones o problemas que se presenten en una
organización y al mismo tiempo sirviendo como base para la toma de decisiones.
1.4.2 Bases Teóricas
Las bases teóricas implican un desarrollo amplio de los conceptos y
proposiciones que conforman el punto de vista o enfoque adoptado, para sustentar o
explicar el problema planteado.
Según Mason, Lin y Marchal. (2000:3). La Estadística se define como:”La
ciencia de recolectar, organizar, presentar, analizar e interpretar datos para ayudar en
una toma de decisiones más efectiva”.
La Estadística moderna ofrece al gerente una gran variedad de herramientas
analíticas en la toma de decisiones bajo incertidumbre, es importante aclarar que esta
incertidumbre no necesariamente corresponde a problemas de administración.
Según Mendenhall y Reinmuth. (1978:23). La Estadística Descriptiva es: “Los
métodos usados para describir conjuntos de datos numéricos”.
Estos métodos pueden ser clasificados de dos tipos: Métodos Gráficos y
Métodos Numéricos. Estos métodos son útiles, no tanto para propósitos descriptivos,
sino para también hacer inferencias. Pueden ser aplicados, tanto para un conjunto de
observaciones de la población o a un conjunto de observaciones de la muestra.
En la Estadística Inferencial: “El objetivo de la Estadística es hacer
inferencias, acerca de una población con base en la información contenida en una
muestra”.
Según Mason et al. (2000:7). La Estadística Inferencial es: “Conjunto de
métodos utilizados para saber algo acerca de una población, basándose en una
muestra”.
Puesto que las poblaciones se caracterizan por medidas descriptivas numéricas
llamadas parámetros, la Inferencia estadística se ocupa de hacer inferencias acerca de
los parámetros de una población. Los métodos para hacer inferencias acerca de
parámetros, pueden clasificarse en dos categorías. Pueden tomarse decisiones acerca
del valor del parámetro y pruebas de hipótesis.
La Estadística Inferencial es: “una parte de la Estadística que comprende los
métodos y procedimientos para deducir propiedades (hacer inferencias) de una
población, a partir de una pequeña parte de la misma (muestra). La bondad de estas
deducciones se mide en términos probabilístico, es decir, toda inferencia se acompaña
de su probabilidad de acierto”.
Según Mason et al. (2000:518). Define: “Las Pruebas de hipótesis aplicables a
los niveles de medición nominal u ordinal, como Pruebas No Paramétricas, llamados
también libres de distribución, el cual implica que en tales pruebas no intervienen
suposiciones con respectos a la distribución de la población de origen”.
Según Shao. (1973:416). La Prueba de Chi Cuadrado ”Es denotada por la letra
griega X², es frecuentemente una prueba para probar hipótesis concernientes a la
diferencia entre un conjunto de frecuencias observadas de una muestra y un conjunto
correspondientes de las secuencias teóricas o esperadas”.
Algunas propiedades importantes de las curvas de la distribución Chi cuadrado
ó X², son como siguen:
La moda de cada distribución, es igual al grado de libertad menos dos, es decir,
moda = (gl)-2 en la escala de X², donde el grado de libertad (gl) debe ser igual o
mayor que 2. Por ejemplo, el máximo valor de Y, para la curva o distribución de
Chi Cuadrado, con el grados de libertad gl=5; es donde la moda está en el punto
de X²=3, es decir, la moda en la escala de X² es igual (5-2)=3.
El área total bajo cada curva es 1 o 100%. La mediana es una distribución X²,
divide el área de la curva en dos partes iguales, siendo cada parte 0,5 o 50%. La
media de una distribución X², es igual al número de grados de libertad.
Las curvas muestran una aproximación bastante rápida hacia la simetría, cuando el
número de grados de libertad aumenta.
La Chi Cuadrada es obtenida de números al cuadrado. Por lo tanto nunca puede
ser negativa. El valor más pequeño posible para Chi Cuadrada es 0, y el mayor
valor posible es el infinito.
Entonces podemos decir que si X²=0, las frecuencias observadas concordarán
exactamente con las frecuencias teóricas o esperadas. Mientras mayor es el valor de
X², mayor es la diferencia entre las frecuencias teóricas y esperadas.
Al probar una hipótesis mediante el uso de la distribución X², podemos
determinar si las diferencias entre los conjuntos de frecuencias son significativas, o si
las diferencias son demasiados grandes para ser atribuibles a fluctuaciones de la
muestras.
Las características de las Pruebas de Chi Cuadrado son las siguientes:
El valor de Chi Cuadrado nunca es negativo, porque la diferencia entre fo y fe se
eleva al cuadrado, esto es (fo y fe)².
Existe una familia de distribuciones de esta clase; una para cada grado de libertad
(gl). El número de grados de libertad esta determinado por (K-1), donde “K” es el
número de categorías, en consecuencia, la forma de la distribución de la muestra
no depende del tamaño de la muestra.
Las distribuciones tienen sesgo positivo, pero conforme aumenta el número de
grados de libertad, la distribución se aproxima a la de tipo normal.
A continuación se desarrollará la teoría correspondiente a las Pruebas de
Hipótesis, que son importantes para poder entender el proceso de aplicación de las
pruebas de Chi Cuadrado. La prueba de hipótesis comienza con una afirmación, o
supuesto, acerca de un parámetro de la población, como la media poblacional, el cual
se denomina este enunciado como la hipótesis.
Según Mason et al. (2000:311). Se define a La Prueba de Hipótesis como: el
“Procedimiento basado en la evidencia muestral y en teoría de probabilidad, que se
emplea para determinar si la hipótesis es un enunciado razonable”.
El procedimiento para probar una hipótesis consta de cinco (5) pasos que son
los siguientes:
Paso 1: Plantear la Hipótesis Nula(Ho) y la Hipótesis Alternativa(H1).
Paso 2: Seleccionar el Nivel de Significancia.
Paso 3: Calcular el Valor Estadístico de Prueba.
Paso 4: Formular la Regla de Decisión.
Paso 5: Tomar una Decisión.
La prueba de hipótesis es un procedimiento sistemático. Al llegar al paso cinco
(5), se tiene ya la capacidad de tomar la decisión de rechazar o no la hipótesis.
A continuación se definirán las aplicaciones de las pruebas de Chi Cuadrado,
siendo éstas las que nos permitirán determinar el valor estadístico y tomar la decisión
en casos determinados.
Según Mason et al. (2000:583). Las Pruebas de Bondad de Ajuste: “Es una
cuyo objetivo es determinar cuán bien se ajusta un conjunto de frecuencias
observadas, a un conjunto esperado de éstas. Considera una sola variable con escala
nominal”. Estas pruebas de Bondad de Ajuste, pueden usarse para cualquier nivel de
datos, estas se pueden presentar de la siguiente manera:
Pruebas de Bondad de Ajuste, para frecuencias esperadas iguales.
Prueba de Bondad de Ajuste, para frecuencias esperadas desiguales.
Para su cálculo, ambas tienen un procedimiento similar al de las pruebas de
hipótesis.
Pruebas de Bondad de Ajuste es: “una prueba estadística para determinar si
existe una diferencia significativa entre una distribución de frecuencias observadas y
una distribución de probabilidad teórica e hipotetizada para describir la distribución
observada”. Según [Link]
Según Mason et al. (2000:583). Las Tablas de contingencia consiste en: “Si
dos características, como educación e ingreso, se registran en clasificación cruzada en
una tabla, el resultado se denomina tabla de contingencia”. El valor estadístico de la
prueba Chi Cuadrado, se aplica para determinar si las dos características están
relacionadas.
La Prueba de Independencia es: “una prueba estadística de proporciones de
frecuencias que se utiliza para determinar si la pertenencia de una variable a
categorías es diferente como función de la pertenencia a la categoría de una segunda
variable”.
En la tabla de contingencia para pruebas de independencia, las frecuencias de
las celdas son llamadas Frecuencias Bidimensionales. En total la frecuencia de cada
hilera o cada columna es llamada la Frecuencia Marginal.
Al probar una hipótesis se involucra una tabla de contingencia, primero se
calcula las correspondientes frecuencias esperadas o teóricas de acuerdo con la
hipótesis. La suma de todas las frecuencias esperadas debe ser igual a las sumas de
todas las frecuencias observadas.
Las tablas de contingencia son usadas frecuentemente en pruebas de
independencia. Este tipo de pruebas nos dirá si son o no independientes (o no
relacionadas), las dos bases de clasificación usadas respectivamente hileras y
columnas.
1.4.3 Definición De Términos Básicos
En los estudios de investigación, a través de algún instrumento de recolección
de datos, hay algunos términos de uso común, que es necesario definir antes de
aplicar cualquier investigación, que requiera el estudio de un fenómeno estadístico.
A continuación se definen algunos términos:
Análisis de Varianza
En este análisis se emplea información muestral, para determinar si tres (3) o
más tratamientos producen o no resultados diferentes.
Alternativa
Son las elecciones disponibles para quien ha de tomar la decisión.
Dato Estadístico
Una característica de una muestra.
Distribución Probabilística
Enumeración de todos los resultados de un experimento, junto con la
probabilidad asociada a cada uno.
Distribución Chi Cuadrada
Es un estadístico muestral que se emplea usualmente para aproximar la
distribución en el muestreo X², cuando las frecuencias esperadas en cada clase son
cinco (5) o más.
Estadística
Ciencia que trata de la recopilación, organización, presentación,
análisis e interpretación de datos numéricos, con el fin de realizar una toma de
decisiones más efectiva.
Estadística Descriptiva
Procedimiento estadístico que sirven para organizar y resumir conjuntos de
datos numéricos.
Estadística Inferencial
Procedimiento estadístico que sirven para deducir o inferir algo acerca de un
conjunto de datos numéricos (población), seleccionando un grupo menor de ellos
(muestra).
Grados de Libertad
El numero de observaciones linealmente independientes en un conjunto de “n”
observaciones. Los grados de libertad, son iguales a “n” menos el número de
restricciones impuestas al conjunto total de datos.
Hipótesis
Enunciado acerca del valor de un parámetro poblacional.
Hipótesis Alternativa
Una afirmación o enunciado que se aceptará si los datos muéstrales
proporcionan amplia evidencia de que la hipótesis nula es falsa.
Hipótesis Nula
Una afirmación o enunciado tentativo que se realiza acerca del valor de un
parámetro poblacional. Por lo común, es una afirmación de que el parámetro de
población tiene un valor específico.
Media
La media aritmética es el promedio que se obtiene, al sumar todos los
elementos en un conjunto de “n” medidas o mediciones X1, X2, X3,…, Xn, dividido
entre los valores de “n”. La media es un valor particular que sirve para representar
una distribución probabilística y es valor promedio a largo plazo de la variable
aleatoria.
Medición Nominal
Es aquel donde los datos sólo se pueden clasificar en categorías y no hay
ningún orden particular de éstas.
Medición Ordinal
Las categorías de datos son mutuamente excluyentes y exhaustivas, dichas
categorías se clasifican u ordenan de acuerdo con las características particulares que
posean.
Muestra Probabilística
Una muestra de elementos que se elijen, de modo que cada miembro de la
población tenga una oportunidad conocida de que se le incluya en la muestra.
Muestra Aleatoria
Se dice que el muestreo es aleatorio, cuando se efectúa de forma que cada
muestra diferente de “n” mediciones tiene igual probabilidad de ser seleccionada.
Nivel de Confianza
Probabilidad de que la estimación efectuada se ajusta a la realidad.
Nivel de Significancia
Es el riesgo que se asume, acerca de rechazar la hipótesis nula cuando en
realidad debe aceptarse por ser verdadera.
Parámetro Poblacional
Es cualquier medida de estadística descriptiva o inferencial, que se calcula de
una población.
Población
Conjunto de todos los posibles individuos, personas, objetos o mediciones de
interés estadísticos.
Probabilidad
Una medida de la probabilidad, de que ocurra un evento en el futuro, ésta solo
puede asumir un valor entre 0 y 1, inclusive.
Pruebas No Paramétricas
Pruebas de hipótesis que implican datos de niveles nominal y ordinal.
Prueba de Hipótesis
Procedimiento que se basa en evidencia muestral y en la teoría probabilística
que se emplea para determinar, si la hipótesis planteada es una afirmación razonable
y debe aceptarse, o si no es razonable y debe ser rechazada.
Prueba Chi Cuadrada para Bondad de Ajuste
Es una prueba cuyo objetivo es determinar cuán bien se ajusta un conjunto de
frecuencias observadas, a un conjunto esperado de éstas. Considera sólo una variable
con escala nominal.
Región de Aceptación
Es el conjunto de valores de la estadística de prueba, que conducen a la
aceptación de la hipótesis [Link]ón de Rechazo
Es el conjunto de valores de la estadística de prueba, que conducen al rechazo
de la hipótesis nula.
Tabla de Contingencias
Es una tabla de dos entradas, para clasificar a los elementos de un grupo de
acuerdo a dos o más características de identificación.
Tabulación
Es el recuento sistemático, ordenado y planificado de los resultados obtenidos;
requisito indispensable para poder extraer conclusiones válidas de la investigación
efectuada.
Teoría Estadística de la Decisión
Se ocupa en determinar cuál acto de decidir, de un conjunto posible de ellos,
es el óptimo para un conjunto particular de condiciones.
Variables Aleatorias
Cantidad que es el resultado de un experimento aleatorio, el cual debido al azar,
puede tomar valores diferente.1.5 Marco Metodológico
1.5.1 Nivel De Investigación
El tipo de investigación según el nivel o grado de profundidad con el que se
realizará el estudio, para responder a la investigación, es de tipo Descriptiva, ya que
se caracterizarán los elementos esenciales del tema, con el fin establecer su estructura
o comportamiento, para posteriormente ser analizados.
1.5.2 Diseño De La Investigación
El tipo de investigación según el diseño o estrategia adoptada se realizará de
manera Documental, es decir, el estudio del problema se hace ampliando y
profundizando el conocimiento de su naturaleza, con apoyo, principalmente en la
revisión de trabajos previos, así como de otras fuentes documentales secundarias.
1.5.3 Fuentes De Información
La información recolectada se obtendrá a través de fuentes documentales
secundarias, relacionadas con el tema de investigación, como lo pueden ser materiales
impresos, audiovisuales y electrónicos.
1.5.4 Técnicas E Instrumentos De Recolección De Datos
Las técnicas utilizadas para la obtención o recolección de información en la
presente investigación y que nos servirán de apoyo para lograr los objetivos
propuestos, se basan principalmente en la observación documental, análisis
documental y de contenido, ya que la investigación es documental; se necesita de la
revisión bibliográfica encontrada sobre el tema a estudiar, así como el análisis de
contenido a la información recabada tanto en textos, vía Internet, fuentes impresas,
tesis, entre otros; para destacar las ideas principales de cada texto, extraer conceptos
de diferentes autores y destacar aquellos aspectos de mayor relevancia que nos serán
útil para desarrollar el tema.
Los instrumentos de recolección de datos utilizados para recoger y almacenar la
información encontrada, que luego será procesada, analizada e interpretada, pueden
ser: En el caso de la observación documental y análisis documental, se puede realizar
por medio del registro de datos en fichas o cualquier otro instrumento que nos
permita almacenar y ordenar los datos extraídos de los mismos documentos, como
computadoras y sus unidades de almacenaje; en el análisis de contenido se podrán
utilizar cuadros de registro.
Por otra parte, en el caso de la información obtenida vía Internet, la misma será
almacenada o guardada a través del la computadora bien sea, por medio del disco
duro, CD o dispositivos USB, llamados Pen drive.
1.5.5 Técnicas De Procesamiento Y Análisis De Datos
La información obtenida será analizada detalladamente a través de la
Estadística a nivel descriptivo y las técnicas lógicas como el análisis, es decir, se
extraen las partes de un todo para estudiarlas por separado y analizar las relaciones
entre ellas; analizando muchos casos. Incluye por tanto un ejercicio de síntesis sobre
los resultados obtenidos en el análisis y serán presentadas mediante herramientas de
visualización como: cuadros estadísticos, tablas e ilustraciones gráficas que
permitirán mostrar los hechos analizados. Todas estas técnicas serán empleadas para
dar respuesta a los objetivos planteados en la investigación.
2.3 Pruebas Paramétricas
Son las pruebas que tienen más potencia para detectar diferencias, pero también
las que tienen más obstáculos para su correcta aplicación, sin embargo, éstas tienen
mayor capacidad para detectar una relación real o verdadera entre dos variables, si es
que existe.
Se llaman Pruebas Paramétricas, porque comparan los grupos a través de una
medida de tendencia central (parámetro), éstas pueden ser: la Desviación Típica y la
Media Aritmética, donde ésta última actúa como una buena medida de resumen,
cuando los datos siguen una distribución normal. Las Pruebas Paramétricas, se
caracterizan esencialmente, porque vienen determinadas por dos parámetros, la media
(µ) y la desviación típica (σ) y su gráfica tiene una forma acampanada y simétrica
alrededor de la media.
Los requisitos para el cumplimiento de las Pruebas Paramétricas son los
siguientes:
Variable numérica: Que las variables de estudio (dependiente), esté medida en
una escala que sea por lo menos de intervalo.
Normalidad: Que los valores de la variable dependiente sigan una distribución
normal; por lo menos, en la población a la que pertenece la muestra.
Homocedasticidad: Que las varianzas de la variable dependiente en los grupos
que se comparan, sean aproximadamente iguales (homogeneidad de las varianzas).
Existen dos limitaciones fundamentales, que se presentan en las Pruebas
Paramétricas las cuales son: Los grupos a comparar deben seguir una distribución
normal y tener igualdad de varianzas.
Otras de las limitaciones es que los grupos de distribuciones deben tener
igualdad de varianzas, es decir, las distribuciones pueden tener el mismo valor en el
parámetro de la media, mostrando la primera valores cercanos a la media (poca
dispersión, varianza pequeña) y la segunda valores alejados de dicho parámetro (más
dispersión, gran varianza), a pesar de que siguen diferentes patrones las variables
tienen en común el mismo valor de la media.
Las Pruebas Paramétricas, se basan en supuestos que plantean: Que los datos de
las variables a comparar se distribuyen de igual forma, pero que entre ellos existe un
desplazamiento fijo; es decir, para cada valor de una muestra hay un valor igual, pero
incrementado en un valor constante (K), al que se puede llamar desplazamiento, si
este valor constante se acerca al valor 0, no habría diferencias entre los grupos, ya que
existiría un solapamiento entre los valores a comparar y cuanto más se aleje del valor
0, mayores serán las diferencias, es importante asumir para este tipo de prueba, que
este valor de desplazamiento de una muestra a la otra es constante. Si por el contrario,
este efecto no fuera constante, ya no se cumplirían los supuestos de estas pruebas.
2.4 Pruebas No Paramétricas
Según Levin, R. y Rubin, D. (1996:786). Las Pruebas No Paramétricas “Son
técnicas útiles, que no hacen suposiciones restrictivas respecto a la forma de las
distribuciones de las poblaciones. Estas se conocen también como pruebas sin
distribución”.
Las pruebas estadísticas no paramétricas, son útiles no solamente cuando los
datos representan una ordenación, sino también cuando se tienen únicamente
diferencias direccionales. La palabra no Paramétrica, está ligada con los tipos de
hipótesis que se prueban usualmente al tener este tipo de datos.
Las pruebas no paramétricas son aplicables, no sólo en casos en que las
mediciones son difíciles de cuantificar, sino también son útiles para hacer inferencias,
en situaciones en la que se tienen serias dudas sobre la satisfacción de la hipótesis que
respaldan la metodología estándar.
2.4.1 Tipos De Pruebas No Paramétricas
Existen diferentes tipos de pruebas no paramétricas, que se pueden utilizar para
una necesidad determinada. En este punto sólo se definen las más conocidas.
Entre las cuales tenemos primordialmente:
Prueba de los Signos
Esta prueba no paramétrica, es usada frecuentemente para tomar decisiones en una
organización.
Según Webster. (1996:855). La Prueba de los Signos, “consiste en contrastar la
hipótesis sobre la mediana de una distribución poblacional, y suele implicar el
empleo de pares coincidentes”.
En ésta prueba se requiere que los valores de la muestra aleatoria, se encuentren
cuando menos en escala ordinal, y no se hacen suposiciones con respecto a la
forma de la distribución poblacional.
Las hipótesis nulas y alternativas pueden designar pruebas de uno o de dos
criterios de clasificación, utilizando (Med) como símbolo para representar la
mediana de la población y la mediana su cero (Med0), para representar el valor
hipotético, entonces se puede plantear la hipótesis nula y alternativa para una
prueba de dos extremos de la forma siguiente:
H0: Med = Med0
H1: Med ≠ Med0
La Prueba de Chi Cuadrado
Es una distribución de probabilidad continua con un parámetro “k”, que representa
los grados de libertad de la variable aleatoria, la distribución de Chi Cuadrado es
denotada por la letra griega X², es frecuentemente usada para pobrar hipótesis,
concernientes a la diferencia entre un conjunto de frecuencias observadas de una
muestra y un conjunto correspondientes de frecuencias teóricas esperadas.
Las Pruebas de Chi Cuadrado, son útiles al analizar más de dos poblaciones, por
ejemplo, sirven para trabajar con datos de Mercadotecnia, también permite
determinar si un grupo de datos descritos de una distribución normal, se ajustan a
la realidad de ese patrón.
El estadístico de Chi Cuadrado se representa de la forma siguiente:
(fo - fe)²
X²= ∑
fe
Donde:
X²= Chi Cuadrado
∑= “La suma de”
fo= Frecuencia observada
fe= Frecuencia esperada
2.4.2 Ventajas De Las Pruebas No Paramétricas
No requieren que hagamos la suposición de que una población está distribuida en
forma de curva normal u otra forma especifica.
Generalmente son fáciles de efectuar y comprender, es decir, la mayoría de las
pruebas no paramétricas no demandan el tipo de laboriosos cálculos menudos
requeridos.
Algunas veces, ni siquiera se requiere del ordenamiento o clasificación formal, es
decir, lo único que se puede hacer es describir un resultado como “mejor” que otro
ó cuando nuestras mediciones no son tan exactas, como es necesario para las
pruebas paramétricas, entonces se pueden usar las pruebas no paramétricas.
2.4.3 Desventajas De Las Prueba No Paramétricas
Ignoran una cierta capacidad de información.
A menudo no son tan eficientes como las pruebas paramétricas.
2.5 Distribución De Probabilidad
Las distribuciones de probabilidad están relacionadas con las distribuciones de
frecuencias, de hecho se puede pensar en la distribución de probabilidad, como una
distribución de frecuencias teóricas que no es más que una distribución de
probabilidades, que describe la forma en que se espera que varíen los resultados.
Debido a que estas distribuciones tratan sobre expectativas de que algo suceda,
resultan ser modelos útiles para hacer inferencias y tomar decisiones en condiciones
de incertidumbre.
Las Distribuciones de Probabilidad, se basan en los valores de las variables
aleatorias, es decir, los datos de las variables estudiadas se deben al azar, como por
ejemplo; el número de unidades vendidas, los niveles de producción diaria, la tallas
de los clientes, etc., son variables cuyos datos pueden ser escogidos al azar. Estos
resultados van acompañados de su respectiva probabilidad de ocurrencia. La
Probabilidad se representa de la siguiente manera:
Decimos que la Probabilidad, de que la variable “X” tome un valor específico,
Xi se escribe:
P(X) = Xi
Por ejemplo, la probabilidad de que en tres lanzamientos de una moneda se
obtengan dos caras es:
P(X=2)= 3/6, entonces de observa que 0 ≤ P(X=Xi) y ∑ P(X=Xi)=1.
2.5.1 Tipos De Distribución De Probabilidad
Las distribuciones de probabilidad, se clasifican como Discretas y Continuas.
La Distribución de Probabilidad Discreta, se dice que está permitido tomar
sólo un número limitado de valores para este tipo de distribución, por lo general
números enteros, por ejemplo: la probabilidad de que una persona haya nacido en
cualquier mes del año, es discreta porque sólo hay doce posibles valores (los 12
meses del año), también lanzar varias veces una moneda y contar el número de caras
representa una Distribución Probabilidad Discreta, ya que en ningún de estos casos
se observan valores fraccionados.
Por otro lado, en una Distribución de Probabilidad Continua, la variable que
se está considerando puede tomar cualquier valor dentro de un intervalo dado, es
decir, los valores pueden ser fraccionados o tomar números infinitos de divisiones,
por ejemplo: La medición de la precipitación diaria y el tiempo de duración de la
misma, a través de un instrumento de medida que tuviera gran precisión como un
chip, se obtuvieran infinitos resultados posibles, como por ejemplo: 2.340,25 Litros
en un tiempo 300 horas, con 33 minutos y 18 segundos.
Es importante mencionar, que dentro de las distribuciones de variables
continuas más importantes se encuentran las distribuciones Chi-Cuadrado las cuales
serán explicadas más adelante.
2.6 Prueba De Hipótesis
Cuando se realiza una prueba de hipótesis, se parte de un valor supuesto
(hipotético) de un parámetro poblacional; luego después de recolectar una muestra
aleatoria, se compara la estadística muestral, así como la media ( ), con el
parámetro hipotético, se compara con una supuesta media poblacional (µ). Después
se acepta o se rechaza el valor hipotético; se puede decir que se rechaza el valor
hipotético, sólo si el resultado muestral resulta muy poco probable, cuando la
hipótesis es cierta.
La diferencia entre el parámetro de la población hipotetizado y la estadística
real, rara vez es tan grande que nos obligue a rechazar nuestra hipótesis, ni tan
pequeña que simplemente la aceptamos sin demora; el problema básico consiste en
enfrentar la incertidumbre, es importante decir que si se acepta o rechaza la hipótesis,
no se puede estar absolutamente seguros de que nuestra decisión sea la correcta; por
consiguiente, se tendrá que aprender a como enfrentar la incertidumbre en la toma de
decisiones sin usar la intuición y decidir objetivamente.2.6.1 Procedimiento De Prueba De
Hipótesis
La prueba de hipótesis es un procedimiento sistemático, que consta de cinco (5)
pasos y al llegar al último paso, se tiene ya la capacidad de tomar la decisión de
rechazar o aceptar la hipótesis nula.
Paso 1: Plantear La Hipótesis Nula (H0) Y La Hipótesis Alternativa (H1).
El primer paso, es plantear la hipótesis que ha se ser aprobada, se le denomina
hipótesis nula, es designada mediante (Ho). En términos generales la hipótesis nula se
plantea con el objetivo de probar, pero se puede rechazar o aceptar.
Hipótesis Nula: Afirmación (o enunciado) acerca del valor de un parámetro,
por ejemplo, si suponemos que deseamos probar la hipótesis de que la media de
población es igual a 500, se simboliza de la siguiente manera:
Ho: μ = 500.
Hipótesis Alternativa: Afirmación de que se aceptará, si los datos muéstrales
proporcionan amplia evidencia de la hipótesis nula es falsa, es decir, si los resultados
de una muestra no respaldan la hipótesis nula, la conclusión que se acepta, se llama
hipótesis alternativa y se designa mediante (H1). Por ejemplo, se pueden considerar
tres hipótesis alternativas de la siguiente manera:
H1: μ ≠ 500 “La hipótesis alternativa es que la media de población no es igual a
500”
H1: μ > 500 “La hipótesis alternativa es que la media de población es mayor a
500”
H1: μ < 500 “La hipótesis alternativa es que la media de población es menor a
500”
3.1 Distribución Chi Cuadrado
Se define a la Distribución Chi Cuadrado como: “Aquella distribución
denominada también ji-cuadrado de Pearson, es una distribución de probabilidad
continua con un parámetro “k”, que representa los grados de libertad de la variable
aleatoria”. Según [Link] Prueba_de_χ² - 20k.
Es considerada como una prueba no paramétrica, que mide la discrepancia entre
una distribución observada y otra teórica (bondad de ajuste), indicando la medida de
las diferencias existentes entre ambas, y de haberlas, se deben al azar en el contraste
de hipótesis, también se utiliza para probar la independencia de dos variables entre sí,
mediante la presentación de los datos en tablas de contingencia.
Las Pruebas de Chi Cuadrado, nos permiten verificar si más de dos
proporciones de poblaciones pueden considerarse iguales. En realidad, éstas nos
permiten hacer muchas cosas y no simplemente probar la igualdad de varias
proporciones. Por ejemplo: si clasificamos una población de diversas categorías
respectos a dos atributos, como la edad y rendimiento en el trabajo, se puede aplicar
entonces la Prueba del Chi Cuadrado, para determinar si ambos atributos son
independientes entre sí.
3.1.1 El Estadístico Chi Cuadrado
El estadístico de Chi Cuadrado, se calcula a través de una fórmula y los
cálculos son fáciles de hacer. Si el valor de Chi Cuadrado da cero, indica que las
frecuencias observadas son exactamente iguales a las frecuencias esperadas. Si el
valor es diferente de cero, entonces este valor obtenido refleja, que hay diferencia
entre los valores observados y los valores esperados, es importante mencionar que
este valor es comparado con otro estadístico de Chi Cuadrado, que se determina
cuando se calculan los grados de libertad y se tiene el nivel de significancia escogido;
este valor es buscado en la tabla de Distribución Chi Cuadrado, correspondiente al
extremo derecho y así se determina si se rechaza la hipótesis nula o se acepta.
La fórmula que da el estadístico es la siguiente:
(fo – fe) ²
X² = ∑
fe
Donde:
X²= Chi Cuadrado
∑= “La suma de”
fo= Frecuencia observada
fe= Frecuencia esperada
El Chi Cuadrado es un estadístico muestral, que se calcula a través de una serie
de pasos, los mismos se pueden observar a través de la fórmula, estos son:
Restamos fe a fo.
Elevamos al cuadrado cada una de la diferencias.
Dividimos entre fe cada diferencia elevada al cuadrado.
Sumamos las respuestas.
Cuanto mayor sea el valor o el resultado de X2, es menor la posibilidad de que
la hipótesis sea correcta. De la misma forma, cuanto más se aproxima a cero el valor
de Chi-Cuadrado, más ajustadas están ambas distribuciones.
3.1.2 Determinación De Los Grados De Libertad
El grado de libertad, es un estimador del número de categorías independientes
en un test particular o experimento estadístico. Para utilizar la prueba de Chi
Cuadrado, debemos calcular el número de grados de libertad (gl), mediante la
aplicación de la siguiente ecuación:
gl = (número de renglones – 1)(número de columnas - 1)
gl = (r-1)(k-1). Donde “r” es el número de filas y “k” el número de columnas.
Existe un criterio de decisión para seleccionar la hipótesis, que es el siguiente:
Se acepta la hipótesis nula (H0), cuando X² < Xt² (r-1) (k-1), en tal caso que sea
contrario se rechaza la hipótesis nula (H0) y se acepta la hipótesis alternativa.
Donde “t” representa el valor proporcionado por las tablas, según el nivel de
significancia estadístico elegido.
3.1.3 Características De La Distribución De Chi Cuadrado
Es una curva asimétrica a la derecha, es decir, con sesgo positivo y las frecuencias
más altas se encuentran en el lado izquierdo de la media; mientras que en el
derecho hay frecuencias más pequeñas.
A continuación se presenta una gráfica que muestra la distribución asimétrica
positiva, en donde se puede apreciar que hacia el lado izquierdo de la media, van a
estar las frecuencias más altas y hacia el lado derecho de la media se encuentran
las frecuencias más pequeñas.
Para el cálculo del segundo intervalo, la probabilidad de que una botella
elegida al azar, se halla llenado a una presión entre 580 y 590 psi, se calcula de la
forma siguiente:
Z= X - µ
Tabla N° 17. Resultados de la encuesta si están a favor, en contra ó son indiferentes
ante la nueva ley.
Hombres Mujeres Total
A favor 90 (87,5) 85 (87,5) 175
En contra 30 (27,5) 25 (27,5) 55
Sin decisión 5 (10,0) 15 (10,0) 20
Total 125 125 250
Cálculo del estadístico de Chi Cuadrado:
El procedimiento siguiente es aplicar el estadístico de Chi cuadrado, a partir de las
distribuciones que se encuentran en la tabla N° 17, y su fórmula es la siguiente:
(fo – fe) ²
X² = ∑
fe
(90 – 87,5)² (85 – 87,5)² (15 – 10)²
X²= + +…..+ = 5,6
87,5 87,5 10
3.5. Otras Consideraciones De Las Pruebas De Chi Cuadrado.
La distribución de probabilidad tiene diferentes funciones, para los distintos
valores dados representados por “X²”. Las ecuaciones ó integrales no tienen una
solución conocida, y sólo se conocen métodos numéricos para calcular sus valores,
hay distintos tipos de tablas y algoritmos para ordenador, con los que se pueden
calcular sus soluciones a través de la tabla distribución Chi Cuadrado.
3.5.1 Para Otros Valores De “X²”
A continuación se muestra una gráfica que representa el valor de “X²”, cuando
la probabilidad del valor crítico es mayor a la del valor de Chi Cuadrado.
Figura N° 13. Gráfica para una variable mayor que “X²”.
Para calcular la probabilidad cuando el valor crítico de Chi Cuadrado para los
diferentes grados de libertad es mayor que el valor de Chi Cuadrado representado de
la siguiente manera: P (X²k > X), se realiza a través de la siguiente expresión:
P (X²k < X) + P (X²k > X) = 1
La probabilidad de que la variable estadística sea menor que “X”, más la
probabilidad de que sea mayor que “X”, es la certeza de probabilidad 1.
Para resolver la siguiente ecuación, cuando la variable estadística es mayor que
“X”, se presenta un ejemplo:
P (X²k > X) = 1 - P (X²k < X)
El presente ejemplo consiste en calcular la distribución de probabilidad de una
variable estadística Chi Cuadrado, de 6 grados de libertad que sea mayor de 3,4.
P (X²6 > 3,4)
Según la ecuación anterior:
P (X²6 > 3,4) = 1 – P (X²6 < 3,4)
El procedimiento siguiente después de haber planteado la ecuación, es buscar
en la tabla de probabilidades de Chi Cuadrado y se obtiene el siguiente valor:
P (X²6 > 3,4) = 0,242777
Con el valor crítico obtenido de Chi Cuadrado se tiene que:
P (X²6 >3,4)=1–0,242777; y obteniendo como resultado el siguiente valor, el
cual es el valor buscado; P (X²6 > 3,4
3.5.2 Para La Variable Mayor Que X1 Y Menor Que X2
A continuación se muestra una gráfica que representa el valor de “X²”, cuando
la probabilidad del valor crítico es mayor que “X1” y menor que “X2”.
Figura N° 14. Gráfica para una variable mayor que X1 y menor que X2.
Para calcular la probabilidad del valor de Chi Cuadrado para diferentes grados
de libertad cuando es mayor que X1 y menor que X2, se expresa de la siguiente
forma:
P (X1 < X²k < X2); siendo X1 < X2 se tiene que:
P (X1 < X²k < X2) = P (X²k < X2 ) - P (X²k < X2 )
A continuación se presenta un ejemplo que explica la ecuación anterior, que
consiste en buscar la probabilidad de que una variable de Chi Cuadrado a 8 grados de
libertad, este comprendida entre 3,4 y 5,6.
Esto se representa de la siguiente manera:
P (3,4 < X²8 < 5,6); el procedimiento que sigue es buscar la probabilidad de
estos valores, según la tabla de probabilidades de Chi Cuadrado, al buscarlos se
obtuvo el siguiente resultado:
P (X²8 < 3,4)= 0,093189
P (X²8 < 5,6)= 0,308063
Según lo anterior se tiene que:
P (3,4 < X²8 < 5,6) = P (X²8 < 5,6) - P (X²8 < 3,4); luego se procede a sustituir
los valores:
P (3,4 < X²8 < 5,6) = 0,308063 – 0,093189
P (3,4 < X²8 < 5,6) = 0,214874; es la probabilidad ó el valor buscado para las
variables de “X1” y “X2”.
3.5.3 Interpolación Lineal De La Distribución Chi Cuadrado
La función Chi Cuadrado, es continua para “X” mayor que cero, pero en la
tabla solo se recogen algunos de sus valores, la tabla podría hacerse más extensa y el
número de valores recogidos siempre sería finito; entonces para calcular los valores
no recogidos en la tabla se puede emplear la Interpolación Lineal.
A continuación se presenta una Gráfica que muestra los valores cuando se da
una Interpolación lineal, para las distribuciones de Chi Cuadrado.
Figura N° 15. Gráfica que representa la Interpolación Line
La interpolación lineal, parte de unos puntos conocidos de la función, y los
valores intermedios los determina por la recta que une estos dos puntos, este método
siempre añade un cierto error, al sustituir la función: y= f(x) por la recta que une dos
puntos: y= r(x), que siempre será menor que tomar el valor conocido más próximo de
la función, ver la figura N°15, es importante que los puntos tomados estén lo más
próximos entre sí, para que este error sea el mínimo posible.
La expresión siguiente, determina el valor de la función para un “X” dado,
partiendo de dos puntos conocidos (X1,y1), (X2,y2), siendo “X”, un valor intermedio
entre; X1 y X1 : X1 < X <X2.
(X - X1)
y= (y2 - y1) + y1
(X2 - X1)
A continuación se presenta un ejemplo, que consiste en calcular cual es la
probabilidad de una distribución Chi Cuadrado a 5 grados de libertad, cuando “X” sea
menor que 1,75 y se representa de la siguiente manera:
P (X²5 < 1,75)
Este valor no se encuentra la tabla de probabilidades de Chi Cuadrado, pero se
tienen que:
P (X²5 < 1,6)= 0,098751
P (X²5 < 1,8)= 0,123932
El procedimiento siguiente es sustituir en la expresión presentada a
continuación:
(X - X1)
y= (y2 - y1) + y1
(X2 - X1)
Luego se tiene que, sustituyendo en la fórmula se encuentra el resultado
buscado:
(1,75 – 1,6)
y= (0,123932 – 0,098751) + 0,098751
(1,8 – 1,6)
(0,15)
y= (0, 025181) + 0,098751
(0,2)
y= 0,018886 + 0,098751= 0,117637
P (X²5 < 1,75)= 0,117637.
CONCLUSIONES
La Estadística es una ciencia con base matemática, es decir, que estudia cómo
debe emplearse la información y cómo dar una guía de acción en situaciones prácticas
que denotan incertidumbre, asimismo busca explicar condiciones regulares en
fenómenos de tipo aleatorio, ésta hoy en día ofrece al gerente una gran variedad de
herramientas analíticas en la toma de decisiones, como lo es la Estadística No
Paramétrica.
La Estadística No Paramétrica es útil y comprensible; se puede utilizar para el
estudio y proceso de análisis de un conjunto de observaciones de los datos que
representan una ordenación, como lo son las tablas de frecuencias, también son útiles
para hacer inferencias, en situaciones en la que se tienen serias dudas y se desea saber
entre diferentes alternativas cual es la mejor selección a escoger; es por ello que esta
ligada al planteamiento de hipótesis.
Las Pruebas No Paramétricas más utilizadas son las Pruebas de Chi Cuadrado
las cuales se aplican a través de Pruebas de hipótesis, estas pruebas son: las prueba de
Bondad de Ajuste, la prueba de Independencia y la Prueba de Homogeneidad.
La Prueba de Bondad de Ajuste, estas pruebas miden el grado en que los datos
muéstrales que son observados, cumplen una distribución hipotética determinada y si
el grado de cumplimiento es razonable, se puede deducir que la distribución
hipotética existe.
La Prueba de Independencia, lo que busca es resolver aquellas situaciones en
las que se está interesado en determinar; si dos variables están relacionadas, en las
RECOMENDACIONES
Hoy en día es importante darse cuenta que vivimos en una constante toma de
decisiones, en diferentes contextos como pueden ser familiar, laboral y empresarial
entre otros.
En el mundo empresarial se vive en una constante incertidumbre, es por ello
que los gerentes deben utilizar la estadística como una herramienta que le permite
resolver problemas. En éstas existen una gran diversidad de datos y los gerentes se
ven a menudo obligados a tomar decisiones, por ello es recomendable que utilicen
sistemas de soportes de decisiones basados en modelos estadísticos, como los son las
Pruebas de Chi Cuadrado.
Esta prueba se caracteriza por tener un procedimiento sistemático que le
permitirá al gerente recolectar, analizar e interpretar inteligentemente los datos
relevantes en su toma de decisión, solucionar problemas en una diversidad de
contextos, agregar soporte a las decisiones, es decir, tomar decisiones de manera
objetiva y reducir el trabajo de adivinar, esto permitirá que los resultados objetivos
sean realistas con un margen de error mínimo, reduciendo así costos y el riesgo que
tendría al tomar .