0% encontró este documento útil (0 votos)
24 vistas39 páginas

Analisis Estadistico

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
24 vistas39 páginas

Analisis Estadistico

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIVERSIDAD AUTONOMA

GABRIEL RENE MORENO


FACULTAD INTEGRAL ICHILO
CARRERA INGENIERIA INDUSTRIAL

GESTION: II-2024
DOCENTE: ING. PATRICIA A. RAIMONDI M.

APUNTES DE ESTADISICA
DESCRIPTIVA
ESTADISTICA DESCRIPTIVA
• La estadística descriptiva es la técnica
matemática que obtiene, organiza, presenta y
describe un conjunto de datos con el propósito
de facilitar el uso, generalmente con el apoyo de
tablas, medidas numéricas o gráficas. Estas
técnicas son utilizadas en el proceso de
investigación, en la etapa donde el investigador
necesita procesar y analizar los datos
recolectados en dicho estudio.
ANALISIS DE DATOS EN EXCEL
• Un análisis de datos en Excel consiste en utilizar
las herramientas y funciones que ofrece esta
plataforma para organizar, interpretar y
visualizar grandes volúmenes de información
con el objetivo de extraer conclusiones útiles.
Mediante funciones avanzadas
como fórmulas (SUMIFS, VLOOKUP, etc.),
tablas dinámicas y gráficos, es posible detectar
patrones, identificar tendencias y realizar
comparaciones entre diferentes variables.
ANALISIS DE DATOS EN EXCEL
• Además, Excel permite automatizar procesos
mediante macros, facilitando el manejo eficiente
de grandes conjuntos de datos. Es una opción
ideal para quienes desean realizar análisis sin
necesidad de software especializado.
Medidas de tendencia central
• Datos no agrupados
• MEDIA ARITMÉTICA la media o promedio es
una medida de tendencia central y se define
como la suma de todos los valores observados de
la muestra, dividida entre el numero total de
datos n.
• Donde:
• 𝑥=ҧ media o promedio
• n= cantidad de valores observados
• Xn= valor observado que se identifica mediante el
subíndice 1.2 …. N i el subíndice i
La estatura media como
• Σ= símbolo que significa «la suma de» resumen de una población
• Datos agrupados homogénea (abajo) o
heterogénea (arriba).
• MEDIA ARITMÉTICA
• Donde:
• 𝑥= ҧ media o promedio
• n= suma de frecuencias
• fi= frecuencia de una celda o frecuencia de un
valor observado
• h= cantidad de celda o de valores observados
Medidas de tendencia central
• Medidas de tendencia central datos no agrupados
• MEDIANA: Se me define como el valor que ocupa
el lugar centra de todos los datos cuando estos están
ordenados de menor a mayor .
• La median se puede hallar solo para variables
cuantitativas
• Donde:
• Me= mediana
• MEDIANA
• Medidas de tendencia central datos agrupados
• Li: limite inferior del intervalo de la mediana
• n= tamaño de muestra
• Fi-1= frecuencia absoluta acumulada del intervalo
anterior al intervalo de la mediana
• Fi= frecuencia absoluta simple de intervalo de la
mediana
• a= amplitud del intervalo de la mediana. Se le resta
al limite superior el limite inferior del intervalo de la
mediana
Medidas de tendencia central
• Datos no agrupados
• MODA: se define como el valor que
ocurre con mayor frecuencia, en algunos
datos la moda puede existir o no ser única
en otros casos.
• Donde:
• Mo= valor moda
• Datos agrupados
• MODA
• Donde:
• Mo = valor modal
• Linf= limite inferior de la clase modal es
aquella que presenta una mayor frecuencia
absoluta
• d1= diferencia de frecuencia entre la clase
modal y la clase precedente
• d2= diferencia de frecuencia entre la clase
modal y la clase subsecuente
• c= amplitud de la clase modal
Medidas de dispersión
• Datos no agrupados
• DESVIACIÓN ESTÁNDAR o
desviación típica σ es un valor
numérico, expresado en la unidades de
los valores observados, que mide la
tendencia a la dispersión de los datos.
• Donde :
• s=desviación estándar
• n= cantidad de valores observados Varianza
• Xi= valor observado
• 𝑥=media
ҧ
• Datos agrupados
• DESVIACIÓN ESTÁNDAR:
• s=desviación estándar
• n= suma de frecuencias
• fi= frecuencia de una celda o frecuencia de un valor
observado
• h= cantidad de celda o de valores observados
MEDIDAS DE FORMA ASIMETRIA
• La simetría (también denominada
sesgo) de una distribución de
frecuencias hace referencia al grado
en que valores de la variable,
equidistantes a un valor que se
considere centro de la distribución,
poseen frecuencias similares.
• Es un concepto más intuitivo a nivel
visual, especialmente, si se observa
una representación gráfica
(diagrama de barras, histograma...)
de la distribución de frecuencias.
Ésta será simétrica si La mitad
izquierda de la distribución es la
imagen especular de la mitad
derecha.
TIPOS DE ASIMETRIA
• Asimetría positiva o ala derecha si se tiene una cola extendida
a la derecha, o hacia valores grandes de la variable en este caso la
media aritmética es mayor a la moda y la mediana esta
comprendida entre ambas
• Asimetría negativa o a la izquierda: Cuando la cola está en el
lado izquierdo. O hacia valores pequeños de la variable. Este caso la
media aritmética es menor que la moda.
INDICES DE ASIMETRIA
Sesgo es una medida numérica de la asimetría
en la distribución de un conjunto de datos.
Se obtiene a través del sesgo y del sesgo
estandarizado (skewness) los cuales están dados
por:
Coeficiente de asimetría
El signo del sesgo indica el lado para el que la Casim)
cola de la distribución es mas larga hacia la 𝑠𝑒𝑠𝑔𝑜
izquierda (signo -) o hacia la derecha (signo +)
𝑠𝑒𝑠𝑔𝑜 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑜 =
6
Para los datos que siguen una distribución
𝑛
normal el valor del sesgo estandarizado debe Donde:

caer dentro de (-2, +2) por lo que si n es grande
n > 100 y el sesgo estandarizado esta fuera del
n = tamaño de muestra
s = la desviación estandar
intervalo será una evidencia de que la 𝑥ҧ =la media muestral
distribución de los datos no es normal.
Medidas de forma asimetría
Comparación con los limites de
aceptación o tolerancias
MEDIDAS DE FORMA
• CURTOSIS O APUNTAMIENTO: Estadístico
que mide que tan elevadas o plana es la
curva de la distribución de unos datos
respecto a la distribución normal.
• Se obtiene a través del estadístico llamado
curtosis y del coeficiente 𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠
de curtosis
𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑖𝑧𝑎𝑑𝑜 =
𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠

estandarizado. 24
𝑛

Donde:
n = tamaño de muestra
s = la desviación estándar
𝑥ҧ =la media muestral
Medidas de forma curtosis
• Si el signo de la curtosis es positivo indica que la
curva de distribución de los datos es mas empinada
o alta (picuda) en el centro y con colas
relativamente largas.
• Per si es negativo se tendrá un curva mas aplanada
con colas mas cortas con respecto a la normalidad.
• El valor de curtosis estandarizada debe estar dentro
de -2 +2 por lo que si n es grande n > 100 y la
curtosis estandarizada esta fuera del intervalo será
una evidencia de que la distribución de los datos no
es normal.
Medidas de forma TIPOS DE CURTOSIS
• Si este coeficiente es nulo, la distribución se
dice normal (similar a la distribución normal
de Gauss) y recibe el nombre de mesocúrtica.
G2 = 0

• Si el coeficiente es positivo, la distribución se


llama leptocúrtica, más puntiaguda que la
anterior. Hay una mayor concentración de los
datos en torno a la media. G2 > 0

• Si el coeficiente es negativo, la distribución se


llama platicúrtica y hay una menor
concentración de datos en torno a la media.
sería más achatada que la primera. G2 < 0

Histograma
• Se emplea los histogramas para
representar a una clasificación de
datos que como usualmente se
expresan los datos de variable
continua, o también a una gran
cantidad de datos de variable discreta.
• Utilidad:
• Identificación de causa raíz
• Para seguimiento de los avances en las
acciones de la mejora de la calidad
• El histograma consta de tres
propiedades
• Forma
• Acumulación o tendencia central
• Dispersión o variabilidad

17
18

HISTOGRAMA
• En estadística, un histograma es
una representación gráfica de una
variable en forma de barras, donde
la superficie de cada barra es
proporcional a la frecuencia de los
valores representados.
• En el eje vertical se representan las
frecuencia de clase, y en el eje
horizontal los valores de las
variables, normalmente señalando
las marcas de clase, es decir, la
mitad del intervalo en el que están
agrupados los datos.
• Los histogramas son más frecuentes
en ciencias sociales, humanas y
económicas que en ciencias
naturales y exactas.
HISTOGRAMA - Definiciones
Intervalos de clase se llama intervalo de clase al simbolismo que define a una
clase. Los intervalos de clase pueden ser ;
Al extremo inferior se llama limite inferior de clase (Linf).
Al extremo superior se llamara Limite superior de clase (Lsup)
Cerrados [a,b] o también como: a ≤ 𝑥 ≤ 𝑏
Abiertos ]a,b[ o también como: a < 𝑥 < 𝑏
Semicerrados [a,b[ o también como: a≤ 𝑥 < 𝑏 ; ]a,b] o también como: a< 𝑥 ≤ 𝑏
Frecuencia de clase: se llama frecuencia absoluta de clase a la frecuencia
correspondiente a una clase.
Clases (k) Son los intervalos en que se divide la característica sobre la que se han
tomado los datos. El número de clases es igual al de barras del Histograma.
Numero de clase k se calcula por diferentes regla una es la Regla de Sturges
Amplitud de recorrido o rango (R), es el intervalo que contiene dicho datos y
que puede calcularse a partir de restar el valor mínimo al valor máximo
considerado.
R = valor max - valor min
Amplitud de intervalo de clase (c): es la longitud del intervalo que define la
clase se halla dividiendo el rango sobre la clase. El intervalo de clase se llama
también ancho de intervalo o tamaño de intervalo. c= R/k
Marca de clase: es el punto medio del intervalo que representa a dicha clase,
se obtiene promediando el limite inferior y superior de clase.
𝐿𝑖𝑛𝑓+𝐿𝑠𝑢𝑝
Yi = 2
Reglas para la cantidad de intervalos
La tabla siguiente muestra el número de Intervalos o clases
sugeridos por tres reglas para valores elegidos de la cantidad
n de datos entre 10 y 300.
a) 10 log10 n, Dixon y Kronmal(1965)
b) 2 n 1/2 , Velleman (1976)
c) 1 + log2 n , Sturges (1926).
La Regla de Sturges, propuesta por Herbert Sturges en 1926, es
una regla práctica acerca del número de clases que deben
considerar al elaborarse un histograma.
Este número viene dado por la siguiente expresión:
K= 1+log2n
donde n es el tamaño de la muestra
Que puede pasarse a logaritmo base 10 de la siguiente:
K=
1+1.33log10n
El valor de “k" (número de clases) es común redondearlo al
entero más cercano.
Reglas para la cantidad de intervalos
Un criterio usado frecuentemente es que el número de clases debe ser
aproximadamente a la raíz cuadrada del número de datos. m = 𝑛
Por ejemplo, la raíz cuadrada de 30 ( número de artículos) es mayor que
cinco, por lo que se seleccionan seis clases.

Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de


cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean.
CONSTRUCCION DE UN HISTOGRAMA
• Paso 1
– Determinar el rango de los datos. Rango es
igual al dato mayor menos el dato menor.
– R = valor max – Valor min.
• Paso 2
– Obtener los números de clases (k), existen
varios criterios para determinar el número de
clases (o barras)
• Paso 3
– Establecer la amplitud de clase (c): es igual al
rango entre el número de clases.
– Dividir el Rango entre la cantidad de clases
– Ejemplo: R = 15 y k = 8 c= R /k = 15/8 = 1.875
se toma 2
CONSTRUCCION DE HISTOGRAMA
• Paso 4
– Construir los intervalos de clases: Los intervalos resultan de dividir el rango
de los datos en relación al resultado del PASO 2 en intervalos iguales.

• Tabla de frecuencias
Representación en forma de tabla
de la distribución de uno datos a
los que se clasifica por su
magnitud en cierto numero de
clases


• Paso 5 Graficar el histograma: En caso de que las clases sean todas de la
misma amplitud, se hace un gráfico de barras, las bases de las barras son las
marcas de clases y las altura son la frecuencia de las clases.
INTERPRETACION DEL HISTOGRAMA
• 1. Observar la tendencia central de los
datos: localizar en el eje horizontal o
escala de medición las barras con
mayores frecuencias.
• 2. Estudiar el centrado del proceso:
observar la posición central del cuerpo
del histograma con respecto a la
calidad optima de las especificaciones.
• Aun cuando se cumplan las
especificaciones si el proceso no esta
centrado, la calidad que se produce no
es adecuada, así que se procede a
realizar los ajustes o cambios
necesarios para centrar el proceso.
INTERPRETACION DEL HISTOGRAMA
• 3. Examinar la variabilidad del
proceso: consiste en comparar la
amplitud de las especificaciones con
el ancho del histograma. Para
considerar que la dispersión no es
demasiada el ancho del histograma
de caber de forma holgada en las
especificaciones
• 4. Analizar la forma del histograma:
Al observar el histograma considerar
la forma de distribución de campana
es la que mas se da en salidas de
proceso y tiene características de
distribución normal sino es de este
tipo es señal de que algo este
ocurriendo en el proceso y tiene
efecto negativo en la calidad.
INTERPRETACION DEL HISTOGRAMA
• Formas típicas que no coinciden con una distribución
de campana.
• Distribución sesgada:
• Distribución multimodal ( dos modas o picos)
• Distribución muy plana:
• Distribución con acantilados
5. Datos Raros atípicos: una pequeña cantidad de
mediciones muy extremas o atípicas son identificadas
con facilidad mediante un histograma debido a que
aparecen una o mas barras pequeñas bastante separadas
aisladas del resto
Un dato raro refleja un situación especial que se debe
investigar entre la principales causas:
INTERPRETACION DEL HISTOGRAMA
• El Dato incorrecto ya se a por error de
medición, de registro o de do cuando fue
introducido a la computadora
• La medición fuera realizada sobre un articulo
o individuo que no forma parte del proceso o
población a la pertenece el resto.
• Si han sido descartadas las dos situaciones
anteriores entonces la medición se debe a un
evento raro o especial.
• 6. Estratificar: en ocasiones en el histograma se
observa ninguna forma particular pero existe
mucha variación y en consecuencia la
capacidad del proceso es baja cuando los datos
proceden de distintas maquinas, proveedores,
lotes, turnos u operadores, pueden encontrarse
información valiosa si se hace por cada fuente
(estratificar con lo se determinar cual es el
problema)
28

Problemas de interpretación
de los histogramas
• Errores a evitar
❑Contentarse con pocos
datos.
❑Considerarlo sólo como
instrumento de
representación y no de
análisis.
❑Confundirlo con el
diagrama de Pareto.
LIMITACIONES DEL HISTOGRAMA
• 1. No considera el tiempo
en el que obtuvieron los
datos, no se detecta
tendencias que ocurren
a través del tiempo
• 2. No es la técnica mas
apropiada para
comparar de manera
practica varios procesos
o grupos de datos.
• 3. la cantidad de clase o
barras influye en la
forma del histograma
EJEMPLO DE
HISTOGRAMA.
En un proceso de inyección de plástico una característica
de calidad del producto (disco) es un grosor que de se de
1,20 mm con una tolerancia de ± 0,10 mm.
Así para considerar el proceso de inyección fue
satisfactorio el grosor del disco debe estar entre la
especificación inferior EI = 1,10 y la superior ES = 1,30
en un estudio de capacidad para este proceso en
necesario contestar las siguientes interrogantes
Que tipo de disco en cuanto al grosor se esta produciendo
El Grosor medio es adecuado La variabilidad del grosor
es mucha o poca
Para contestar esta pregunta durante una semana se
obtuvieron de una línea de producción los 125 datos de
la tabla 2.1 el muestreo fue sistemático cada determinado
tiempo se tomaban 5 productos y se median al final de
la semana se tuvieron los datos referidos a continuación
de analizaran los datos utilizando el histograma.
Ejemplo Histograma
1,15 1,20 1,17 1,16 1,16 1,15 1,17 1,20 1,16 1,19 1,17 1,13 1,15 1,20 1,18 1,17 1,16
1,20 1,17 1,17 1,20 1,14 1,19 1,13 1,19 1,16 1,18 1,16 1,17 1,15 1,21 1,15 1,20 1,18
1,17 1,17 1,13 1,16 1,16 1,17 1,20 1,18 1,15 1,13 1,20 1,17 1,19 1,23 1,20 1,24 1,17
1,17 1,17 1,17 1,18 1,24 1,16 1,18 1,16 1,22 1,23 1,22 1,19 1,13 1,15 1,15 1,22 1,19
1,18 1,19 1,17 1,16 1,17 1,18 1,19 1,23 1,19 1,16 1,19 1,20 1,17 1,13 1,22 1,19 1,21
1,20 1,19 1,17 1,19 1,22 1,19 1,18 1,11 1,19 1,19 1,17 1,19 1,17 1,20 1,16 1,19 1,20
1,20 1,17 1,25 1,16 1,16 1,20 1,20 1,16 1,18 1,21 1,20 1,22 1,19 1,14 1,19 1,17 1,20
1,16 1,15 1,20 1,12 1,11 1,18
Ejemplo de histograma
CONSTRUCCION DE HISTOGRAMA
Calculo de amplitud de clase c = R/k
tolerancia 0.10 c= 0.14/8 0.02
Número de datos n = 125 EI 1.10 Determinacion de los limite de clase
ES 1.30 1.10 + 0.02 = 1.12
Calculo de Rango R 1.12 + 0.02 = 1.14
R = max - min 1.14 + 0.02 = 1.16
R = 1.25 - 1.11 R= 0.14 1.16 + 0.02 = 1.18
1.18 + 0.02 = 1.20
1.20 + 0.02 = 1.22
Calculo de la Clases
1.22 + 0.02 = 1.24
Regla de Sturgess k = 1+ Log2 N 1.24 + 0.02 = 1.26
Determinacion de marca de clase
k = 1 + 3.3.log10 N N = numero de datos (1.10 +1.12)/2 1.11
(1.12 +1.14)/2 1.13
(1.14 +1.16)/2 1.15
k = 1 + 3.3xlog10 (125) = 7.9 8 clases (1.16 +1.18)/2 1.17
(1.18 +1.20)/2 1.19
(1.20 +1.22)/2 1.21
(1.22 +1.24)/2 1.23
(1.24 +1.26)/2 1.25
Ejemplo de histograma
Para datos agrupados
Marca Frecuencia
Grosor de discos Frecuencia Frecuencia Frecuencia Frecuencia
Clase de Clase Acumulativa
(longi de clase) (ni) Relativa Porcentual % Acumulativa
Yi porcentual
1 ]1.10 ,1.12] 1.11 3 0.024 2.4% 3 2.4%
2 ]1.12 ,1.14] 1.13 8 0.064 6.4% 11 8.8%
3 ]1.14,1.16] 1.15 26 0.208 20.8% 37 29.6%
4 ]1.16 ,1.18] 1.17 34 0.272 27.2% 71 56.8%
5 ]1.18 ,1.20] 1.19 39 0.312 31.2% 110 88.0%
6 ]1.20 ,1.22] 1.21 9 0.072 7.2% 119 95.2%
7 ]1.22 ,1.24] 1.23 5 0.04 4.0% 124 99.2%
8 ]1.24 ,1.26] 1.25 1 0.008 0.8% 125 100.0%
125 1 100.0%
Calculo de medidas de tendencia
central y dispersión Percentil
Maximo 1.25 Datos de Grosor del disco
Minimo 1.11
Rango R 0.14 1.0% 1.11
Media muestral 1.174 5.0% 1.125
10.0% 1.135
Mediana 1.190
25.0% 1.17
Moda 1.170 50.0% 1.19
Desviación estándar muestral σ 0.027 75.0% 1.21
Coeficiente de asimetria -0.0114 distribución bastante simetrica 90.0% 1.23
Curtosis 0.173188 distribucion normal 95.0% 1.23
99.0% 1.23
Primer Cuartil (Percentil 25)
1,17
Valor de la mediana
1,19
(percentil 50)

Tercer cuartil (Percentil 75) 1,21


Calculo de Histograma a traves de
Excel FORMULAS EN EXCEL
Maximo
MAX(número1; [número2]; ...) 1.25
Minimo
MIN(número1; [número2]; ...) 1.11
Rango
Rango = R = MAX - MIN 0.14
Media muestral
PROMEDIO(número1, [número2], ...) 1.179
Mediana
MEDIANA(número1; [número2]; ...) 1.18
Moda
MODO(número1;[número2];...]) 1.17
Desviación estándar σ
DESVESTP(número1;[número2];...]) 0.027
Coeficiente de Asimetria
COEFICIENTE. ASIMETRIA (MATRIZ 1; MATRIZ 2) -0.0114
Coeficiente de Curtosis
CURTOSIS(número1; [número2]; ...) 0.173188
Calculo de histograma a través de
Excel
CUARTIL
Primer Cuartil (Percentil 25)
CUARTIL(matriz;cuartil) 1 1.160
Valor de la mediana (percentil 50)
CUARTIL(matriz;cuartil) 2 1.180
Tercer cuartil (Percentil 75)
CUARTIL(matriz;cuartil) 3 1.200
PERCENTIL
PERCENTIL(matriz;k) K = 0.01
Percentil 1.0 % (0.01) 1.11 1.11 1.0%
Percentil 5.0 % (0.5) 1.130 1.125 5.0%
Percentil 10% (0.10) 1.150 1.135 10.0%
Percentil 25 % (0.25) 1.160 1.17 25.0%
Percentil 50 % (0.50) 1.180 1.19 50.0%
Percentil 75 % (0.75) 1.200 1.21 75.0%
Percentil 90 % (0.90) 1.210 1.23 90.0%
Percentil 95 % (0.95) 1.220 1.23 95.0%
Percentil 99 % (0.99) 1.240 1.23 99.0%
Calculo de histograma a través de
Excel
Clase Frecuencia
1.11 2
1.13 7
Histograma
1.15 11 60
Frecuencia

1.17 40 40
1.19 31 20
1.21 22 0
1.23 9 1.11 1.13 1.15 1.17 1.19 1.21 1.23 1.25
1.25 3 Clase
Ejemplo de histograma Interpretación
• En el histograma se aprecia que la tendencia central de los datos se
ubica alrededor de 1,18 , no se observa datos raros y atípicos y la
distribución de los datos tiene una forma similar a una campana.
• Si en el histograma se insertan las especificaciones 1,10 y 1,30 para
el grosor del disco se observa que la variación de los datos
(amplitud de histograma) es un poco menor a las especificaciones.
• Pero con respecto a 1,20 que es el grosor optimo el proceso esta
moderadamente descentrado a la izquierda como ya se había visto
cuando se calculo la media , Además el grosor del disco no es
satisfactorio ya que la orilla izquierda del histograma debería estar
alejada de la especificación inferior EI= 1,10 lo cual no ocurre.
• La acción de mejora de la capacidad de proceso de inyección de
disco es mejorar el centrado

También podría gustarte