CARACTERIZACION
Variables Cuantitativas
Cr. Jorge de Souza Martinez
crjdesouzamartinez@[Link]
097351538
Una variable se llama cuantitativa
cuando toma valores numéricos,
podemos distinguir dos tipos
Variable cuantitativa discreta
Variable cuantitativa continúa
VARIABLE CUANTITATIVA DISCRETA
Es aquella variable que puede tomar únicamente un
número finito de valores.
Por ejemplo, el número de hermanos, numero de
materias.
VARIABLE CUANTITATIVA CONTINUA
Es aquella variable que puede tomar cualquier
valor intermedio entre dos posibles.
Por ejemplo, la estatura, el tiempo, el peso.
Para caracterizar una variable
cuantitativa, se debe hacer teniendo
en cuenta la forma como se van a
presentar los datos
-DATOS AGRUPADOS
-DATOS SIN AGRUPAR
DATOS AGRUPADOS
Los datos se tratan como datos agrupados cuando en
la distribución de los datos se tienen varios valores
distintos, en lugar de algunos valores repetidos.
Por lo tanto esta clase de datos se agrupan en intervalos
de igual tamaño denominados intervalos de clase.
DATOS NO AGRUPADOS
Los datos se tratan como datos no agrupados cuando en
la distribución de los datos se observa que la variable
puede tomar valores repetidos.
Por lo tanto esta clase de datos no necesita ser agrupada en
intervalos, ya que al repetirse en varias ocasiones la
variable, los datos pueden ser representados con el valor
que toma la variable y su respectiva frecuencia.
Variables Cuantitativas
para datos no agrupados
Cr. Jorge de Souza Martinez
crjdesouzamartinez@[Link]
097351538
Para caracterizar una variable
cuantitativa, cuyos datos no estan
agrupados, se utilizan un grupo de
medidas
-MEDIDAS DE TENDENCIA CENTRAL
-MEDIDAS DE POSICION
-DIAGRAMA DE CAJAS Y BIGOTES
MEDIDAS DE TENDENCIA CENTRAL
Las medidas de tendencia central permiten encontrar
las características de la variable cuando los datos se
concentran en el centro.
Principalmente son: la media aritmética, la mediana y
la moda
MEDIDAS DE POSICION
Las medidas de posición dividen el conjunto
de datos en partes porcentuales e iguales.
Principalmente son: cuartiles, los deciles y
los percentiles
CUARTILES
Los cuartiles son valores de
la variable que dividen el
conjunto ordenado de datos
en cuatro partes iguales
DECILES
Los deciles son
valores que dividen
el conjunto de datos
en diez partes iguales
PERCENTILES
Los percentiles son
medidas que dividen un
conjunto de datos en cien
partes porcentualmente
iguales
.
DIAGRAMA DE CAJA Y
BIGOTES
(boxplots o box and
whiskers)
Resumen grafico en el que se
describen las características mas
destacadas de un conjunto de datos
son una presentación visual que describe varias
características importantes, al mismo tiempo, tales
como la dispersión y simetría.
PARA SU REALIZACIÒN
se representan los tres cuartiles y los valores mínimo y
máximo de los datos, sobre un rectángulo, alineado
horizontal o verticalmente.
Construcción
Una gráfica de este tipo consiste en una caja
rectangular,
donde los lados más largos muestran el recorrido
intercuartílico.
Este rectángulo está dividido por un segmento
vertical que indica donde se posiciona la mediana y
por lo tanto su relación con los cuartiles primero y
tercero(recordemos que el segundo cuartil coincide
con la mediana).
Esta caja se ubica a escala sobre
un segmento que tiene como
extremos los valores mínimo y
máximo de la variable.
BIGOTES
Las lineas que sobresalen de la caja se llaman bigotes.
Estos bigotes tienen un límite de prolongación.
EJEMPLO
Utilizamos la siguiente distribución de
frecuencias que representan la edad de un
colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Para calcular los parámetros estadístico,
lo primero es ordenar la distribución
20 23 24 24 24 25 29 31 31 33 34
36 36 37 39 39 40 40 41 45
Q1, el cuartil Primero es el valor mayor
que el 25% de los valores de la
distribución. Como N = 20 resulta que
N/4 = 5; el primer cuartil es la media
aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es,
evidentemente, la mediana de la
distribución, es el valor de la variable
que ocupa el lugar central en un
conjunto de datos ordenados. Como N/2
=10 ; la mediana es la media aritmética
de dicho valor y el siguiente
Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que
sobrepasa al 75% de los valores de
la distribución. En nuestro caso,
como 3N / 4 = 15, resulta
Q3=(39 + 39) / 2 = 39
DIBUJAR CAJA Y BIGOTES
El bigote de la izquierda
representa al colectivo de edades
( Xmín, Q1) La primera parte de la
caja a (Q1, Q2), La segunda parte de
la caja a (Q2, Q3) El bigote de la
derecha viene dado por (Q3, Xmáx).
UTILIDAD
Podemos obtener abundante información de una
distribución a partir de estas representaciones.
La parte izquierda de la caja es
mayor que la de la derecha;
ello quiere decir que las edades comprendidas entre el
25% y el 50% de la población está más dispersa que
entre el 50% y el 75%.
El bigote de la izquierda (Xmín, Q1)
es más corto que el de la derecha;
por ello el 25% de los más
jóvenes están más
concentrados que el 25%
de los mayores.
El rango intercuartílico = Q3 -
Q1 = 14,5
es decir, el 50% de la población está
comprendido en 14,5 años.
COMPARAR
DISTRIBUCIONES
Comparación entrenamientos de un corredor
Un corredor entrena para una
determinada carrera y se toman
los tiempos que necesita para
recorrer los 200 m, durante 10
días consecutivos (cada día se
toman varios tiempos y se
calculan mediana, cuartiles,
valores mínimo y máximo)
Observamos que el
desplazamiento de
las gráficas de caja
hacia la izquierda
indica que el
entrenamiento ha
dado resultado, ya
que se tardan menos
segundos en recorrer
la misma distancia,
siendo la diferencia
entre el máximo y el
mínimo menor,
como así también la
diferencia
intercuartílica.
ejercicio
Las edades de los 12 estudiantes de Contabilidad del
grupo diurno son las siguientes:
19, 22, 45, 24, 19, 20, 22, 21, 20, 26, 28, 33
Mientras que las edades de los 8 estudiantes de
Contabilidad en el grupo nocturno son:
31, 25, 28, 26, 25, 30, 27, 44.
Se pide:
a) Construye un diagrama de cajas para cada grupo
que represente la distribución de las edades de sus
estudiantes
b) ¿Qué representa el valor del tercer cuartil en el
grupo diurno?
c)¿Qué representa el valor del primer cuartil en el
grupo nocturno?
d) Compara la dispersión de las edades del 50%
central en cada grupo.
ejercicio
Se realizó un estudio a un grupo de 50 estudiantes de
2do año de la carrera contador público con el fin de
recoger información sobre la cantidad de horas
semanales que se dedican a la actividad laboral:
0 0 0 0 0 0 0 0 0 0 4 4 4 4 6 6 8 1 4 14 14 20 20 20 20 20
20 20 20 20 20 20 20 25 25 25 25 30 30 40 40 40 40 40
40 40 40 40 44 54
Se pide
a) Representa los datos mediante un diagrama de cajas.
b) Completa las siguientes afirmaciones a partir del
diagrama de cajas:
i) El 75% de los estudiantes trabajan al menos
___________________ hs semanales.
ii) La mitad de los estudiantes trabaja a lo sumo
_____________________ hs semanales.
iii) La mayor diferencia en la cantidad de hs semanales
trabajadas dentro del 50% central de los datos es
______________________ hs semanales.
Ejercicio-Se estudia la cantidad de locales
que tiene una empresa en cada uno de los
19 departamentos.
De los datos se sabe que:
A) Hay un departamentos sin locales.
B) El departamento con más locales tiene 20.
C) El 25% de los departamentos con menos locales tiene a lo sumo 8.
D) La mitad de los departamentos con más locales tiene por lo menos 12.
E) La mayor variabilidad en el número de locales entre departamentos cuyos
números de locales estén en el 50% central de los datos es de 6.
Se pide
Representa los datos de la empresa en un diagrama de
cajas.
Variables Cuantitativas
para datos agrupados
Cr. Jorge de Souza Martinez
crjdesouzamartinez@[Link]
097351538
Para caracterizar y representar datos
agrupados se utilizan las siguientes
herramientas
· Diagramas de tallo y hoja.
· Tablas de distribución de frecuencias
· Histogramas
· Ojivas
· Polígonos de frecuencia
Diagrama de tallo y hoja
Representación gráfica que permite clasificar un
conjunto de datos de acuerdo con la expresión decimal
de cada uno de ellos,
con este esquema se obtiene simultáneamente una
distribución de frecuencias de la variable.
CONSTRUCCIÒN
Un diagrama de tallo y hojas divide
cada uno de los datos del conjunto de
datos en tallo y hoja.
Para construirlo
el tallo de cada dato corresponde a la primera o
primeras cifras del dato y,
en la mayoría de los casos se toma como
la hoja el último dígito de la derecha.
EJEMPLOS
A) si el valor de un dato es 28, el valor del
tallo corresponde a 2 y el valor de la
hoja corresponde a 8.
B) Si los datos tienen tres dígitos, los dos
primeros serán el tallo y el último
digito será la hoja.
en el valor 167, el valor del tallo será 16 y el
de la hoja 7. En este caso la representación
en un diagrama de tallo y hoja será:
TALLO HOJA
16 7
EJ: se toma la altura de 20 alumnos
del grado octavo. Obteniéndose los
siguientes datos.
Altura de 20 alumnos del grado octavo
145 149 152 154 155
155 156 156 157 158
159 159 160 161 162
164 171 172 172 176
caracterización y
representación gráfica
Población: Estudiantes grado octavo I.E.
Juan Manuel González.
Muestra: 20 estudiantes.
Variable: Altura
Tipo de Variable: Cuantitativa continúa
Primer paso
identificar el dato menor y mayor, y sus respectivos
tallos.
Dato menor 145 Tallo 14
Dato mayor 176 Tallo 17
Lo que quiere decir que el menor de nuestros tallos es
14 y el mayor 17.
Segundo paso
identificar los tallos adicionales que
necesitaremos entre 14 y 17
identificamos que necesitamos un tallo en 15 y otro
en 16
ya que existen datos a representar con estos tallos en la
tabla de datos como son por ejemplo: 152 y 162.
Tercer paso
Dibujar una tabla con dos columnas, la primera
columna para el tallo y la segunda para las hojas.
Disponer todos los tallos en la primera columna en
orden descendente. Cada tallo solo se escribe una vez
TALLO HOJA
14
15
16
17
Cuarto paso
Registrar en la segunda columna todas las hojas de
los datos consignados en la tabla de datos.
TALLO HOJAS
14 5 9
15 2 45 56678 99
16 1 02 4
17 1 62 2
Quinto paso
ordenamos en orden ascendente las hojas del
diagrama tallo y hoja
TALLO HOJAS
14 59 2 DATOS
15 2455667899 10 DATOS
16 0124 4 DATOS
17 1226 4 DATOS
Finalmente sacamos conclusiones y
la información requerida
2 estudiantes miden entre 140 y 149.
10 estudiantes miden entre 150 y 159.
4 estudiantes miden entre 160 y 169.
4 estudiantes miden entre 170 y 176
La clase modal correspondiente a nuestro
ejemplo es el intervalo 150-159, pues es allí
donde están ubicados la mayoría de los
datos
Graficas
Cr. Jorge de Souza Martinez
crjdesouzamartinez@[Link]
097351538
VENTAJA de trabajar expresando información en
diferentes tipos de gráficas estadísticas
información clara y rápida del conjunto de datos
obtenidos en el estudio o investigación en cuestión.
gráficos estadísticos más usuales
Gráfico o diagrama de barras
Gráfico o diagrama de sectores
Histograma
Polígono de frecuencias
Pictograma
Gráfico o diagrama de barras
suele expresar mediante la elevación de barras de
diferente color (pueden ser horizontales) aquella
información que intenta dilucidar un sólo aspecto
entre un grupo de personas encuestadas
Gráfico o diagrama de Sectores
ideal para representar porcentajes en una situación
similar a la anterior
encuesta acerca del color de cabello de los asistentes a
una escuela
Histograma
Se trata de una representación gráfica de una variable
determinada a través de barras, en las cuales su
superficie es proporcional a la frecuencia de los
valores hallados. El eje vertical marca las frecuencias,
y el horizontal los valores posibles de las variables
Polígono de frecuencias
Se trata de un tipo de gráfico lineal que utilizamos
para la representación de la incidencia de respuesta de
una variable cuantitativa. El polígono surge de unir los
puntos medios de las bases superiores de las barras de
un diagrama de barras, e incluso también de un
histograma
Pictograma
Se trata de un gráfico donde se sustituyen los elementos
abstractos (como las barras) por dibujos relativos a la
temática de lo que se está graficando
cuántas veces por semana comen las personas frutas o verduras