Estadística Descriptiva: Análisis y Métodos
Estadística Descriptiva: Análisis y Métodos
TABLA DE CONTENIDO
OBJETIVO........................................................................................................................................3
INTRODUCCION..............................................................................................................................4
1. ESTADISTICA DESCRIPTIVA..........................................................................................................5
1.6 CUANTILES..........................................................................................................................30
1.7 GRAFICOS............................................................................................................................36
CONCLUSIÓN................................................................................................................................47
BIBLIOGRAFIAS.............................................................................................................................48
2
3
OBJETIVO
conceptos e ideas que algunos aún desconocen, logrando así que se aprenda a resumir
datos para una y dos variables. Familiarícese con el uso de métodos gráficos para mostrar
Para llevar a cabo ciertos ejercicios enfocados en los subtemas mencionados, para ser
desarrollados con facilidad y entendimiento, mostrando así que, muchos temas antes no vistos
4|Página
INTRODUCCION
Las matemáticas nacieron desde hace años, por lo que con el tiempo han ido avanzado
más, y aunque las matemáticas no se pueden cambiar, es decir, son un tema ya exacto, por lo
que son ejercicios que cambian en su concepto, sin embargo, la forma de desarrollarlo sigue
siendo la misma.
Mencionando más específicamente, este material habla acerca de una rama muy
importante de dicha materia, en esta se menciona que es una disciplina la cual es la encargada
de ordenar y calcular tipos de parámetros sobre el conjunto de algunos datos, pudiendo así
5|Página
1. ESTADISTICA DESCRIPTIVA
ordenar, realizar tablas o gráficos y calcular parámetros básicos sobre el conjunto de datos. La
estadística descriptiva es, junto con la inferencia estadística o estadística inferencial, una de las
dos grandes ramas de la estadística. Su propio nombre lo indica, trata de describir algo. Pero
caja de verduras, en la altura de una persona o en la cantidad de dinero que gana una
empresa. De estas variables podríamos decir muchas cosas. Por ejemplo, podríamos indicar
que esta o aquella caja de tomates pesan mucho o pesan menos que otras. Siguiendo con otro
ejemplo, podríamos decir que el ingreso de una empresa varía mucho a lo largo del tiempo o
Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy variable o
poco variable necesitamos variables de medidas. Esto es, necesitamos cuantificarlas, ofrecer
un número. Con esto en mente, podríamos utilizar los gramos o los kilogramos como unidad de
medida para saber el peso de tantas cajas de tomates como consideremos. Una vez pesemos
treinta cajas, sabremos cuales pesan más, cuales pesan menos, que cuantía es la que más se
repite o si existe mucha disparidad entre los pesos de las diferentes cajas.
Con esta idea nace la estadística descriptiva, con la de recoger datos, almacenarlos,
realizar tablas o incluso gráficos que nos ofrezcan información sobre un determinado asunto.
Adicionalmente, nos ofrecen medidas que resumen la información de una gran cantidad de
datos.
cuantitativa.
6|Página
Variable cualitativa: Hace referencia a una cualidad. Ejemplos: el color de ojos de una
los resultados relacionados con un conjunto de datos derivados de una muestra o de toda la
importantes y sobre todo diferentes. La mediana es un indicador que “no tiene en cuenta los
valores extremos, a veces poco frecuentes”, a diferencia de la media, que está muy influida por
forma significativa y comprensible, lo que a su vez da pie a una interpretación simplificada del
de tendencias y patrones puede ser un reto. Además, los datos en bruto dificultan la
visualización de lo que muestran los datos. Además, el uso de la estadística descriptiva permite
complejos.
7|Página
Una variable estadística es el conjunto de valores que puede tomar cierta característica
medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los ingresos
mensuales, las horas de sueño de un paciente en una semana, el precio medio del alquiler en
las viviendas de un barrio de una ciudad, etc. Las variables estadísticas se pueden clasificar
Cualitativa (o categórica): son las variables que pueden tomar como valores cualidades
o categorías.
Ejemplos:
Ejemplos:
8|Página
1.1 POBLACIÓN Y MUESTRA ALEATORIA
comunes con el fin de estudiarlos y de esta forma se sacar conclusiones específicas para
determinar sus resultados. Así podemos hablar de la población de sustantivos en las obras de
Jorge Luis Borges o de la población de notas asignadas en los cursos a nivel universitario.
medidas en el Campus de San Martín es infinita, ya que, por lo menos teóricamente, podemos
la población. Pero, si la población es muy grande o potencialmente infinita tenemos que estar
a ganar las próximas elecciones podríamos preguntar a todo aquel que tiene derecho a votar
cómo piensa votar para sacar el resultado. En la práctica esta metodología resultaría
demasiado costosa, por lo que hacemos una muestra representativa de votantes, les
preguntamos y generalizamos.
Resulta evidente que hay que tener cuidado al seleccionar una muestra para análisis.
Los métodos estadísticos, los que nos permiten generalizar e inferir, suponen que las muestras
están tomadas de manera aleatoria o al azar. Esto no significa que la muestra sea arbitraria,
sino que cualquier unidad de la población que estamos estudiando tiene la misma probabilidad
Para tener una muestra verdaderamente aleatoria de una población deberíamos asignar
un número u otro identificador único a cada una de las unidades de la población –a cada
9|Página
persona si se trata de una población humana– escribir cada número en un papel y echarlos en
una tómbola. Luego de virarla por algún tiempo y mesclar bien los papeles, podríamos de allí
sacar la cantidad de papeles que corresponda al tamaño de nuestra muestra. Obviamente esto
no resulta muy práctico por lo que se suele empezar con una secuencia de números aleatorios
del tamaño de la muestra y extraer unidades de la población basado en ello. Por ejemplo, si
quisiéramos sacar veinte libros al azar de un estante de la biblioteca que contiene doscientos
libros, necesitamos veinte números aleatorios entre uno y doscientos, y sacamos los libros que
desde algún punto de referencia (primer libro del primer nivel) está a esa distancia.
aleatorios que nos permite generar los de números de nuestra muestra con un solo comando
Aunque tengan estos nombres, esos elementos pueden referirse a cualquier cosa y no
solo a personas. Por ejemplo, podemos estudiar los televisores que se montan en una
determinada fábrica, la cantidad de vehículos que se desplazan por carretera un fin de semana
de agosto, o los programas de televisión más vistos en una determinada franja horaria. Cada
determinada ciudad. En general, es muy costoso, en tiempo y dinero; entrevistar a todos los
10 | P á g i n a
elementos objeto del estudio. Por ello, se selecciona solo una parte y en este caso se dice que
se trata de un estudio muestral.
La elección de la muestra es muy importante para que los resultados que se extraigan
de ella se puedan generalizar a toda la población. Debe haber pocos individuos, para que no
sea muy costosa su realización, pero elegidos de forma que aparezcan todos los estratos
diferentes que forman la población. Por ejemplo, si quisiéramos saber los gustos culinarios de
la juventud actual; no bastaría preguntar a las puertas de una pizzería, pues hay una parte de
jóvenes que prefieren otro tipo de comidas y no visitan este tipo de establecimientos. Si lo
conjunto de sujetos que reúnen unas ciertas características que queremos estudiar.
Simplificando, como su propio nombre indica, imagina una población como el conjunto de
habitantes de un país.
En los casos en los que no podemos obtener información de toda la población, ya sea
por falta de medios técnicos o porque los recursos son limitados, hay que hacer uso de una
muestra.
Una muestra estadística es una selección de los sujetos de una población para extraer
la información necesaria para el estudio. Por ejemplo, si queremos saber cuál es el futbolista
11 | P á g i n a
favorito de los habitantes de Ciudad de México, una muestra puede ser una selección aleatoria
de 1.000 individuos.
aportar la información acerca de la población. Una muestra mal seleccionada nos llevará a
además los sujetos de los que se obtiene la información deben ser seleccionados de forma
aleatoria.
Imaginemos que queremos saber la opinión de los ciudadanos españoles acerca de los
millones.
Tampoco podremos preguntar únicamente a los jóvenes, habrá que realizar la consulta
residen.
conjunto de sujetos que reúnen una característica que desea ser estudiada. En cambio, la
muestra es una parte de esa población que se selecciona para obtener la información con la
que se va a trabajar.
12 | P á g i n a
1.1.1 USO DE SOFTWARE
datos mediante un flujo de trabajo repetible y, a continuación, desplegar y compartir los análisis
datos.
comúnmente emplea software estadístico para realizar análisis multivariados y gráficos de los
datos les da protagonismo a las herramientas estadísticas, donde los softwares en la actualidad
segundos.
Las herramientas de análisis estadístico son aliadas de las importantes empresas del
mercado. Hay muchos tipos de programas informáticos estadísticos, algunos de ellos son
complejos y requieren de profesionales en programación para usarlos. Por otro lado, hay otro
tipo de software de uso más intuitivo pero limitado y finalmente se puede programar un
software a la medida
perspectiva amplia del objeto de estudio. Los reportes estadísticos deben contar con ambos
13 | P á g i n a
tipos de información, una simple cifra no siempre alcanza a explicar si un impacto es positivo o
negativo.
costes, también por las nuevas capacidades empresariales que resultan de un cambio
evolutivo.
Toda gestión de calidad de los procesos debe enfocarse en obtener resultados para
de innovación teniendo en cuenta los aspectos que deben cambiar. Conocer la información a
14 | P á g i n a
1.2 OBTENCIÓN DE DATOS ESTADISTICOS
Existen diferentes métodos mediante los cuales se pueden obtener datos estadísticos.
fuente primaria, mientras que la persona que compila la información es la fuente secundaria.
Conducción de una encuesta: Este es otro método para obtener datos estadísticos. Se
análisis.
decisiones.
A continuación, tenemos para ti el siguiente apartado con los diferentes tipos de datos
estadísticos y su clasificación:
Datos categóricos
características como el género, el idioma, etc. de una persona. También pueden tomar valores
numéricos, por ejemplo: 1 para mujeres y 0 para hombres. Ten en cuenta que esos números no
15 | P á g i n a
Datos nominales: Otros de los tipos de datos estadísticos son los que tienen valores
nominales que representan unidades discretas y se usan para etiquetar variables que no tienen
un valor cuantitativo.
Estos datos no tienen un orden, aunque cambiara el orden de sus valores, no cambia su
significado.
lo tanto, es casi lo mismo que los datos nominales, excepto que su orden es importante.
Datos numéricos
Datos discretos: Los datos estadísticos son discretos cuando sus valores son distintos y
separados. Es decir, cuando los datos sólo pueden tomar ciertos valores.
Este tipo de datos no se puede medir, pero se pueden contar. Básicamente representan
siguiente manera:
Datos de intervalo: Los datos de intervalo representan unidades ordenadas que tienen
la misma diferencia. Por lo tanto, hablamos de datos de intervalo cuando tenemos una variable
que contiene valores numéricos que están ordenados y donde conocemos las diferencias
16 | P á g i n a
El problema con los datos de valores de intervalo es que podemos sumar y restar, pero
no podemos multiplicar, dividir o calcular razones. Debido a que no existe un cero verdadero,
Datos de relación: También son unidades ordenadas que tienen la misma diferencia.
Los datos de relación son los mismos que los valores de intervalo, con la diferencia de que
importantes:
decisiones.
Satisfacer nuestra curiosidad.
numérica necesaria para ayudarnos a tomar una decisión con más bases en una situación
particular.
Para que un análisis estadístico sea útil en el proceso de toma de decisiones, los datos
importante. Si los datos están estropeados por sesgos, ambigüedades u otro tipo de error, es
improbable que incluso las metodologías más finas y sofisticadas sean suficientes para
Son números que pueden ser comparados, analizados e interpretados y el campo del
17 | P á g i n a
¿Para qué necesitamos recolectar datos?
Hay, por lo menos, tres maneras de obtener datos y son los siguientes:
A través de la experimentación.
Realizando encuestas.
18 | P á g i n a
1.3 MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda.
Promedio o media
aritmético. Se representa por la letra griega µ cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante
destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto
que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La
media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.
Mediana
ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el
50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un
polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más
alto del gráfico. Una muestra puede tener más de una moda.
19 | P á g i n a
Se llama medidas de posición, tendencia central o centralización a unos valores
numéricos en torno a los cuales se agrupan, en mayor o menor medida, los valores de una
Para que un valor pueda ser considerado promedio, debe cumplirse que esté situado
términos matemáticos.
cuantiles.
Media aritmética
sumar todos ellos y dividir la suma por el número total de valores. La media aritmética se
expresada como .
Dada una variable x que toma los valores x1, x2, ..., xn, con frecuencias absolutas
simbolizadas por f1, f2, ..., fn, la media aritmética de todos estos valores vendrá dada por:
Media ponderada
Entonces, para calcular la media se ponderan dichos valores según su peso, con lo que se
20 | P á g i n a
Si se tiene una variable con valores x1, x2, ..., xn, a los que se asigna un peso mediante
valores numéricos p1, p2, ..., pn, la media ponderada se calculará como sigue:
Mediana
tal que se encuentra en el centro de la serie, con igual número de valores superiores a él que
par, ninguno de ellos ocupará la posición central. Entonces, se tomará como mediana la media
Moda
valor de la variable que posee una frecuencia mayor que los restantes. La moda se simboliza
Un grupo de valores puede tener varias modas. Una serie de valores con sólo una
21 | P á g i n a
Es conveniente mencionar algunas ventajas y desventajas que estas pueden acarrear:
Ventajas:
No se basa en ideas infundadas, ya que estas evitan por todos los medios hacer
Las afirmaciones que realizan van guiadas a conseguir mejoras, las cuales se basen en
Desventajas:
Los parámetros estadísticos son una ayuda a manera de resumen, pero no son
22 | P á g i n a
1.4 MEDIDAS DE DISPERSIÓN
Las medidas de dispersión son números que indican si una variable se mueve mucho,
poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de manera
las medidas de tendencia central. Juntas, ofrecen información de un sólo vistazo que luego
Rango
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo
Donde:
R → Es el rango.
Varianza
datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado
23 | P á g i n a
X → Variable sobre la que se pretenden calcular la varianza
N → Número de observaciones.
Desviación típica
la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz cuadrada
N → Número de observaciones.
Coeficiente de variación
24 | P á g i n a
X → Variable sobre la que se pretenden calcular la varianza
variabilidad de los datos. Es decir, se encargan de mostrar qué tan juntos o separados se
encuentran los datos de una distribución. Por lo general, se usa junto con las medidas de
tendencia central, como la media o la mediana, para proporcionar una descripción general de
un conjunto de datos.
Ahora que ya tienes más claro el concepto de las medidas de dispersión o variabilidad,
ningún detalle:
distribución.
25 | P á g i n a
Sus valores de dispersión siempre son positivos o cero, en caso estos sean iguales.
que existe en los datos y, por lo tanto, los límites dentro de los cuales los datos variarán en
alguna variable, atributo o cualidad medible. En ese sentido, las medidas de dispersión son de
Para que puedas comprender cuál es la utilidad de las medidas de dispersión, veamos
distribución de los datos. A medida que los datos se vuelven más diversos, el valor de la
mejores conocimientos sobre la distribución de datos. Por ejemplo, 3 muestras distintas pueden
tener la misma media, mediana o rango, pero niveles de variabilidad completamente diferentes.
26 | P á g i n a
Las medidas de dispersión también se denominan promedios de segundo orden, es
decir, promediar por segunda vez las desviaciones de una medida de tendencia central.
datos
La media aritmética puede ser la misma de dos grupos diferentes, pero no revelará la
prosperidad de un grupo y el atraso de otro. Este tipo de composición interna puede conocerse
Por lo tanto, con la ayuda de las medidas de dispersión o variabilidad, no concluirás que
ambos grupos son similares. Puedes encontrar que un grupo es próspero y el otro está
27 | P á g i n a
5. Controlan la variabilidad
ángulos, y este conocimiento puede resultar útil para controlar la variación. Sobre todo, en el
análisis financiero de los negocios y la medicina, estas medidas de dispersión pueden resultar
muy útiles.
Las medidas de dispersión son importantes porque nos hablan de la variabilidad que
dispersión es importante porque condiciona el error que vamos a tener a la hora de hacer
variabilidad de los datos. Su relevancia en la formación estadística ha sido señalada por Wild y
Pfannkuch (1999).
28 | P á g i n a
1.5 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
variable por filas. En las columnas se dispone el número de ocurrencias por cada valor,
como cuál es la actitud mayoritaria del grupo, y resulta bastante más difícil determinar la
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañados del número de veces (la frecuencia) que aparece cada valor:
números a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la
variable y 5 frecuencias).
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el
número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"), frecuencias
29 | P á g i n a
frecuencia acumulada relativa es el total de frecuencias relativas de los valores iguales o
interpretación: La tabla es demasiado grande. Para reducir el tamaño de la tabla agrupamos los
valores en intervalos, y las frecuencias son las de los conjuntos de valores incluidos en los
intervalos:
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor número de datos es el 34-39, o que el 75% de los
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en una
distribución de frecuencias
Límites aparentes: Valores mayor y menor del intervalo que son observados en la tabla.
Dependen de la precisión del instrumento de medida. En el ejemplo, los límites aparentes del
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites son 33.5 y
39.5
Punto medio del intervalo (Mco Marca de clase): Suma de los límites dividido por dos.
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto
30 | P á g i n a
1.6 CUANTILES
aleatoria en intervalos regulares. Por tanto, no es más que una técnica estadística para separar
los datos de una distribución. Eso sí, debe cumplirse que los grupos sean iguales. Por eso,
existen diversos tipos de cuantil, como veremos más adelante, en función del número de
forma exacta y, por tanto, no conocemos su función de distribución. Este método aporta valores
similares al anterior cuando la muestra aumenta y, por tanto, es indiferente el uso de ambos.
calcular un valor que tenga una probabilidad determinada en una función de distribución. No
Vamos a mostrar cuales son los cuantiles más utilizados en estadística. La mayoría de
ellos son de uso habitual para poder analizar de forma detallada la distribución de los datos.
Además, otra de sus utilidades es separar los datos en grupos, pudiendo elegir los más altos o
31 | P á g i n a
Cuartil: Separa los valores en cuatro grupos iguales y existen tres cuartiles. Es el más
frecuente. El cuartil uno (Q1) son los datos menores y el tres (Q3) los mayores. Por otro lado, el
cuartil dos (Q2) se corresponde con la mediana (Me) que es un estadístico de posición que
divide la distribución de los datos a la mitad. Los valores del cuantil serían 0.25 (Q1), 0.5(Q2) y
0.75 (Q3).
Quintil: Similar al anterior, es menos frecuente y divide los datos en cinco partes iguales.
Por tanto, hay cuatro quintiles. Los valores del cuantil en este caso serían 0.20, 0.40, 0.60,
0.80.
Decil: En este caso se dividen en diez partes y, por tanto, hay nueve deciles. Una vez
más, este tampoco es demasiado frecuente. Sus valores serían de 0.1 a 0.9.
Percentiles: Estamos ante una variante en que la distribución se divide en cien partes
iguales. Puede ser de interés para muestras muy numerosas. Sus valores van de 0.01 a 0.99.
Ejemplo de cuantil
Veamos un ejemplo en que tenemos una serie de datos de la renta de los habitantes de
cierto municipio. Hemos calculado los tres cuartiles y tres deciles más representativos.
Incluimos las fórmulas utilizadas, teniendo en cuenta que para los deciles utilizamos el
mediana.
Podemos observar que la renta de los individuos que representan el 25% (Q1) menos
favorecido es de 2.900. En relación al decil, la renta del 10% (D1) de los individuos que menos
reciben es de 2.800. La misma interpretación se hace con los superiores, pero al revés. El 25%
(Q3) que más gana obtiene una renta de 4.100 y el 10% de 4.800. El cuantil refleja, por tanto,
32 | P á g i n a
En estadística y probabilidad, los cuantiles son puntos de corte que dividen el
cuantil menos que el número de grupos creados. Los cuantiles comunes tienen
cuartos, etc., aunque a veces los términos para el cuantil se utilizan para los grupos
posible que el valor de un cuantil no se determine de forma única, como puede ser el
Cuantiles especializados
33 | P á g i n a
Los 4 cuantiles se denominan cuartiles → Q; la diferencia entre los cuartiles
Los cuantiles de 1000 se han llamado permilles o milliles, pero estos son raros
estadística o con una muestra extraída de ella. Para una población, de valores
valor del dato donde la función de distribución acumulada cruza k / q. Es decir, x es
34 | P á g i n a
yPr [ X ≤ X] ≥ k / q.
Eso es equivalente a decir que x es el valor más pequeño tal que Pr[ X ≤ x ]
manera equivalente a través del valor de I p = N k / q. Si I p no es un número entero,
número entero, cualquier número desde el valor de datos en ese índice hasta el valor
de una muestra).
cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable que marca un
corte de modo que una proporción p de valores de la población es menor o igual que por
ejemplo, el cuantil de orden 0,36 dejaría un 36% de valores por debajo y el cuantil de orden
35 | P á g i n a
Los cuantiles suelen usarse por grupos que dividen la distribución en partes iguales;
entendidas estas como intervalos que comprenden la misma proporción de valores. Los más
usados son:
36 | P á g i n a
1.7 GRAFICOS
Gráfico de barras
de gráfico es habitual para representar, por ejemplo, los ingresos de una compañía por
trimestres de actividad o la evolución del PIB de un país bien sea anual, semestral, trimestral…
Permite introducir diversas variables y observar su evolución paralela a lo largo del mismo
período de tiempo: en uno de los ejes se establece el tiempo y el otro se levantan las barras
sectores o porciones. Por ejemplo, el porcentaje de alumnos de una clase que realizan una
Este tipo de gráfico es similar al de barras —los datos se ordenan en base a los ejes
variado la temperatura mínima y máxima durante una semana. En uno de los ejes tendremos la
temperatura y en otro los días de la semana. Se marcan los valores de la temperatura mínima y
37 | P á g i n a
se unen con una línea mostrando la oscilación; con otro color se representa de igual forma la
temperatura máxima. De un vistazo, el lector puede ver cómo han oscilado ambas variables en
El punto de partida son también los ejes cartesianos que muestran todos los valores de
relación. El resultado suele ser una nube de puntos que muestra una dispersión o una
concentración y ayuda a los estadistas a determinar la relación o no entre las variables. Estas
variables en barras y otras en línea, siempre que el tipo de datos a representar lo permita.
Otra variación son los pictogramas, gráficos donde las barras o las líneas se sustituyen
por dibujos que muestran la temática de los datos que se están expresando en los gráficos: si
se representa la variación del precio de distintas frutas, el pictograma puede elaborarse con
El gráfico, en otras palabras, es una forma de resumir, en una imagen, una información
Por ejemplo, es mucho más fácil entender qué tan pronunciado ha sido el crecimiento
38 | P á g i n a
1.8 CAJAS Y ALAMBRES
grupos de datos numéricos a través de sus cuartiles. Las líneas que se extienden paralelas a
las cajas se conocen como «bigotes», y se usan para indicar variabilidad fuera de los cuartiles
superior e inferior.
visual que describe varias características importantes, al mismo tiempo, tales como la
dispersión y simetría.
Construcción:
Comparar distribuciones
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos
muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que
indica donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre
39 | P á g i n a
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución.
Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el
siguiente:
la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10; la
Q3, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución.
40 | P á g i n a
El bigote de la izquierda representa al colectivo de edades (Xmín, Q1)
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la población está más dispersa que entre el
50% y el 75%.
El bigote de la izquierda (Xmín, Q1) es más corto que el de la derecha; por ello el 25%
de los más jóvenes están más concentrados que el 25% de los mayores.
Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o más conjuntos
de datos.
41 | P á g i n a
•Un Diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza
un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
distribución. Primero es necesario encontrar la mediana para luego encontrar los 2 cuartiles
restantes.
42 | P á g i n a
1.9 DIAGRAMA DE PARETO
prioridad. También se le denomina curva cerrada o distribución A-B-C. Lo que nos permite es
sociólogo y filósofo italiano, afincado en Suiza hasta su muerte, enunció una regla que parece
cumplirse. Descubrió que el 80% de las actividades que se realizan son triviales y solo suponen
un 20% del resultado y a la inversa. Por tanto, es a las segundas a las que hay que dedicar un
mayor esfuerzo.
de clientes genera el 80% del ingreso. Por ese motivo, es en ellos en los que deberemos
centrar el 80% de nuestro tiempo y a la inversa. El diagrama de Pareto nos permite conocer
descriptiva. Eso sí, dependiendo de las variables a analizar se puede complicar algo más,
sobre todo en el trabajo de campo. Los pasos a seguir pueden ayudarnos a ordenar las ideas y
En primer lugar, hay que hacer una lista de dichas variables. Imaginemos que queremos
conocer las causas de compra de los clientes de un determinado producto, la idea es conocer
43 | P á g i n a
Una vez las tenemos, realizamos el estudio descriptivo. Podemos usar fuentes
Toca dibujar el gráfico, con una hoja de cálculo como Excel. Se utilizan los de barras,
de Pareto las barras se ordenan por conteos de frecuencia, del más alto al más bajo. Estos
diagramas se usan a menudo para identificar áreas en las que centrarse primero en mejora de
procesos.
Los diagramas de Pareto reflejan los conteos ordenados de frecuencia de valores de los
distintos niveles de una variable categórica o nominal. Estos diagramas se basan en la regla
del 80/20. Esta regla sostiene que aproximadamente el 80 % de los problemas se derivan del
20 % de las causas. Esta regla también se conoce como del «puñado esencial y la multitud
trivial». De nuevo, la idea es que podemos centrarnos en unas pocas causas fundamentales en
información de mayor a menor relevancia, con el objetivo de reconocer los problemas más
importantes en los que deberías enfocarte y solucionarlos. Esta técnica se basa en el principio
de Pareto o regla 80/20, la cual establece una relación de correspondencia entre los grupos 80-
44 | P á g i n a
Pareto, también conocido como curva de distribución ABC, consiste en una gráfica que clasifica
los aspectos relacionados con una problemática y los ordena de mayor a menor frecuencia, con
lo que permite visualizar de forma clara cuál es la causa principal de una consecuencia.
aumentando la variedad de los productos. A veces, nosotros mismos podemos ser el peor
enemigo de nuestros productos quitándole ventas para ofrecer otros. Entonces, la función del
diagrama de Pareto es que las empresas puedan reconocer cuáles son las necesidades más
importantes a las que debería dirigir sus esfuerzos y no malgasten recursos en asuntos poco
Analiza las características de un grupo y reconoce los puntos más importantes dentro
personales.
Analiza los elementos y la frecuencia con la que sucede cada uno de los datos.
analizada.
45 | P á g i n a
Eje Y derecho. Refiere al porcentaje que se acumula a partir del total de ocurrencias.
Eje X. En la parte inferior se describen las categorías de las problemáticas o situaciones
Identificar qué productos generan mayores ventas y cuáles tienen más tiempo
almacenados.
Identificar cuáles son las razones por las que ocurren algunos problemas y priorizar las
soluciones.
destacan:
Te ayuda a enfocar los esfuerzos en las mejoras que traerán mayores beneficios.
Es una herramienta fácil de entender y fomenta las ganas de solucionar los problemas
dentro de la organización.
46 | P á g i n a
El Diagrama de Pareto permite definir las prioridades y enfocarse en conocer las causas
raíz para llegar a la solución de problemas de forma efectiva. Al usar esta herramienta puedes
47 | P á g i n a
CONCLUSIÓN
Al finalizar esta investigación, en la cual, tomamos en cuenta todos los subtemas que
vienen ligados al tema principal, nos podemos dar cuenta que son un tema muy interesante, ya
que cada uno de ellos te envuelve de una manera que sin saber mucho acerca de ello, vas
Al haber leído e investigado cada uno de los puntos tratados se hace notar la relación
que se tiene en nuestro día a día y aunque no nos demos cuenta de ello, solo basta poner un
poco de atención para fijarse que toda esta rama esta en todos lados.
48 | P á g i n a
BIBLIOGRAFIAS
[Link]
Economipedia. [Link]
[Link]#:%7E:text=En%20resumen%2C%20la%20diferencia%20entre,que%20se
%20va%20a%20trabajar.
[Link]
[Link]
[Link]
[Link]
[Link]
y gestion. [Link]
tendencia-central#ventajas
[Link]
49 | P á g i n a
Pérez, M. A. R. M. M. (2021, 4 diciembre). Población y muestra | Estadística.
INTEF.
[Link]
ml
[Link]
información. [Link]
QuestionPro. [Link]
estadistica/
50 | P á g i n a