CONTROL ESTADISTICO DE LA CALIDAD
INSTRUCTOR: EVER QUILCA
PARAMETROS
ESTADISTICOS
PARAMETRO DE POSICION
Permiten identificar el valor en torno al cual se agrupan
mayoritariamente los datos, es decir, cuyo valor es
representativo de todos ellos. Pueden ser de dos tipos:
Medidas de tendencia central: media, mediana y moda.
Medidas de posición no central: cuartiles, deciles y
perceptibles.
,
Media Aritmética
Es probablemente el más conocido y usado
en la práctica, pero sólo en el caso de V.A
continúas. La media de una variable X se
denota por x y se calcula como se indica a
continuación. Dado un conjunto de datos
numéricos x1, x2, …, xn, , la media no es más
que la suma de todos los datos dividido por
el número total de valores:
x
i 1
i
x
N
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la
mitad de los datos, una vez que estos están ordenados de menor a
mayor. La mediana se denota por Me y se calcula de manera sencilla.
Ordenados los datos de menor a mayor, Me es:
Si N es un número impar, entonces Me es el valor que ocupa la
posición N 2 1 de la lista de datos ordenados. Démonos cuenta que
en este caso, quedarán el mismo número de datos a un lado y al
otro de la mediana.
Si N es un número par, no tenemos un dato central. En ese caso,
tomamos la media de los dos datos centrales y que sí dejan el
mismo número de valores a un lado y al otro, es decir, la mediana
será la media de los datos que ocupan las posiciones N N 1
2 2
de la lista de datos ordenados.
Moda
La moda, representada por Mo, es otro parámetro de posición
que se calcula simplemente como el valor que más se repite en
la muestra, es decir, el valor con una mayor frecuencia. En
consecuencia, no siempre se sitúa hacia el centro de la
distribución.
Puede haber más de una moda en el caso en que dos o más
valores de la variable presenten la misma frecuencia. Por otro
lado, la moda puede no existir cuando en un conjunto de datos,
todos éstos son diferentes entre sí y no hay ningún dato que se
repita más de una vez.
Parámetros de Dispersión
Recorrido o Rango
Es la medida de dispersión más sencilla de calcular.
Es la diferencia entre el mayor y el menor valor
que toma la variable.
Intervalo Intercuartílico
Se define como la diferencia entre el tercer y primer cuartil. En ese rango
están, por la propia definición de los cuartiles, el 50% de las observaciones
Para el cálculo de los cuartiles debemos ordenar los datos de menor a
mayor: 2, 5, 8, 9, 15, 20, 21. El C1 será igual a 5 y el C3 igual a 20, con lo
que el Intervalo Intercuartílico tendrá un valor de 15.
Varianza y Desviación Típica
La varianza se define como:
N
x i x
2
S2 i 1
N 1
POBLACION Y MUESTRA
MODA
MUESTRAL
MODA
POBLACIONAL
CALCULO DE MEDIA, VARIANZA Y DESVIACIÓN
ESTÁNDAR PARA LA DISTRIBUCIÓN DISCRETA
O también llamada distribución de probabilidades, muestra los
posibles resultados de un experimento y la probabilidad de que
cada uno se presente.
Características de una distribución de probabilidad
La probabilidad de un resultado en particular se encuentre
entre 0 y 1 .
Los resultados son eventos mutuamente excluyentes.
La suma de las probabilidades de los diversos eventos es igual a
uno
LA VARIABLE ALEATORIA
Una variable x es aleatoria si el valor que toma , correspondiente al al
resultado de un experimento, es una probabilidad o evento aleatorio
Es una descripción numérica de los resultados de un experimento.
La variable aleatoria discreta es la que se asocia a un experimento de conteo
y por lo tanto solo asume valores enteros
¿cual es la diferencia entre una variable aleatoria y una distribución de
probabilidad?
Una variable aleatoria representa el resultado particular de un experimento.
Una distribución de probabilidad representa todos los resultados posibles, así
como la correspondiente probabilidad
CALCULO DE MEDIA, VARIANZA Y DESVIACIÓN
ESTÁNDAR PARA LA DISTRIBUCIÓN CONTINUA
Para una variable continua hay infinitos valores posibles de la variable y entre cada
dos de ellos se pueden definir infinitos valores más. En estas condiciones no es
posible deducir la probabilidad de un valor puntual de la variable; como se puede
hacer en el caso de variables discretas, pero es posible calcular la probabilidad
acumulada hasta un cierto valor (función de distribución de probabilidad), y se
puede analizar como cambia la probabilidad acumulada en cada punto (estos
cambios no son probabilidades sino otro concepto: la función de densidad.
Parámetros de distribución binomial, poisson y
normal
LEY BINOMIAL
La distribución binomial se asocia con este tipo de
experimentos: Realizar n veces un experimento en el
cual solo tenemos en cuenta la posibilidad de éxito o
fracaso.
Que se obtenga éxito o fracaso en cada ocasión es
independiente del éxito o fracaso obtenido en el resto
de ocasiones.
La probabilidad de obtener éxito o fracaso siempre es la misma en todas las
ocasiones. – La obtención de éxito o fracaso en cada ocasión es
independiente de la obtención de éxito o fracaso en las demás ocasiones.
Siendo p la probabilidad de éxito y q la probabilidad de fracaso (q=1-p)
– La probabilidad de obtener éxito o fracaso siempre es la misma en cada
ocasión.
La distribución binomial se suele representar por B(n, p).
Siendo n el número de intentos y p la probabilidad de éxito.
LEY PIOSSON
El interés que tiene un proceso de Poisson radica en saber
cuántos sucesos se producen en un intervalo de tiempo t .
Una variable que sigue la ley de Poisson, puede tomar
cualquier valor entero del intervalo [0,) siendo la
probabilidad de obtener uno de estos
ESTANDARIZACION DE VARIABLES PARA LA
DISTRIBUCION NORMAL
La distribución normal estándar, o tipificada o reducida, es
aquella que tiene por media el valor cero, μ = 0, y
por desviación típica la unidad, σ =1.
La gráfica de la distribución normal tiene la forma de una campana, por
este motivo también es conocida como la campana de Gauss. Sus
características son las siguientes:
• Es una distribución simétrica.
• Es asintótica, es decir sus extremos nunca tocan el eje horizontal,
cuyos valores tienden a infinito.
• En el centro de la curva se encuentran la media, la mediana y la moda.
• El área total bajo la curva representa el 100% de los casos.
• Los elementos centrales del modelo son la media y la varianza.
En el gráfico, el área sombreada corresponde a
la probabilidad de encontrar un valor de la
variable que sea igual o inferior a un valor
dado. Esa probabilidad es la que aprenderemos
a determinar usando una tabla estandarizada.
TABLA DE LA DISTRIBUCIÓN
NORMAL
La tabla de la distribución normal presenta los valores de
probabilidad para una variable estándar Z, con media igual a 0 y
varianza igual a 1.
Para usar la tabla, siempre debemos estandarizar la variable por
medio de la expresión:
debemos calcular Z usando los datos de
nuestra muestra.
En general, el valor de Z se interpreta como el número de
desviaciones estándar que están comprendidas entre el promedio y
un cierto valor de variable x. En otras palabras, se puede decir que es
la diferencia entre un valor de la variable y el promedio, expresada
esta diferencia en cantidad de desviaciones estándar.
Ejemplo:
Supongamos un conjunto de personas con edad promedio 25 años y
desviación estándar 3,86. Nuestro valor de interés (x) es 30 años. El
valor de Z correspondiente será:
Este valor de Z nos dice que la edad de 30 años está a 1,29
desviaciones estándar sobre el promedio.
Ahora bien, la tabla de la distribución normal, entrega valores de
probabilidad para los distintos valores de Z.
USO DE LAS TABLAS
¿CÓMO SE USA LA TABLA DE Z?
Lo averiguaremos con un valor concreto: ¿cuál es la probabilidad de
encontrar un valor de Z menor o igual a 1,96?
Vamos a la tabla y familiaricémonos con algunas de sus
características.
▪ En la primera columna de la tabla aparece el entero y primer
decimal del valor de Z, vemos que los valores van desde -3,4 a 3,3. En
la primera fila (arriba), aparece el segundo decimal del valor de Z y,
como es lógico, hay 10 números (0,00 a 0,09).
▪ Entonces, para nuestro valor de Z = 1,96 buscaremos 1,9 en la primera columna
de la tabla y 0,06 en la primera fila de la tabla. Trazaremos líneas perpendiculares
desde esos valores y llegaremos a un número en el cuerpo de la tabla (véase la
tabla más abajo, que tiene marcadas las dos perpendiculares de las que hablamos.
El número que encontramos y que está destacado es: 0,9750.
▪ Por lo tanto, la probabilidad asociada a Z=1,96 es 0,9750, es decir, la
probabilidad de encontrar un valor de Z menor o igual a 1,96 es 0,9750.
En nuestro ejemplo anterior, con la edad 30 años, vemos que el valor Z = 1,29
tiene una probabilidad asociada de 0,9014. Entonces, la probabilidad de encontrar
una persona con edad de 30 años o menos, en este grupo humano, es 0,9014.
TABLA DE DISTRIBUCIÓN NORMAL.