Estadística
UNIDAD I
CENTRO DE ESTUDIOS ORGANIZACIONALES
| A-1360
Tecnicatura Superior en Administración de Empresas
¡Bienvenidos a la cursada de Estadística!
El espacio curricular que aquí nos convoca, bajo el nombre de “Estadística”,
tiene como finalidad que los estudiantes sean capaces de obtener, organizar y
analizar datos para poder realizar inferencias y, de esta manera, poder realizar
una toma de decisiones con un nivel de error controlado. Por ello es que resulta
una parte imprescindible en la formación de los futuros Técnicos Superiores en
Administración de Empresas.
Los objetivos que les proponemos para Estadística son:
Desarrollar competencias estadísticas para el tratamiento de la
información en su aspecto descriptivo.
Aprender a fundamentar rigurosamente el cálculo de probabilidades
Conocer mecanismos para llevar adelante la inferencia estadística.
Comprender el significado de pronósticos temporales y los componentes
de las series.
Establecer modelos de predicción y ajuste.
Identificar los modelos de probabilidad y su relación con resolución de
acciones empresariales.
Interpretar resultados de muestra de datos numéricos y saber utilizarlos en
la toma de decisiones.
Es nuestra intención que Ustedes transiten un recorrido de aprendizaje utilizando
los recursos y propuestas que la modalidad a distancia ofrece y para tal fin, los
invitamos a dialogar, no sólo con nosotros, sino también entre ustedes y con los
materiales que están a vuestra disposición en la plataforma virtual de CEO.
Les recordamos que será imprescindible la participación en el foro virtual de la
asignatura, así como el cumplimiento de los trabajos acordados con el profesor.
Los contenidos por los que iremos transitando a lo largo de este espacio
curricular son los siguientes:
Introducción a la estadística. Población y muestra. Estadística
descriptiva e inferencial. Etapas de la tarea estadística. Variables
empíricas. Distribución de frecuencias. Gráficos.
Análisis descriptivo de datos. Medidas de tendencia central. Medidas
de variabilidad y concentración. Cálculo e interpretación de medidas de
tendencia central y dispersión.
Probabilidad. Repetición del fenómeno aleatorio. Definición frecuencial.
Ley de los grandes números. Probabilidad condicional. Teorema de
Bayes. Aplicaciones.
1
Variables aleatorias discretas. Función de probabilidad. Esperanza
matemática. Varianza. Distribución binomial. Distribución
Hipergeométrica. Distribución de Poisson.
Variables aleatorias continuas. Función de densidad. Función de
distribución. Distribución normal. Parámetros. Noción sobre el Teorema
Central del Límite. Aplicaciones.
Tengan en cuenta que estos contenidos se han organizado para su mejor
aprendizaje en módulos separados por unidad, con la siguiente secuencia:
Unidad n° Contenido
1 Estadística descriptiva
2 Análisis descriptivo de datos
3 Probabilidades
4 Variables aleatorias discretas y continuas
Orientaciones
para el
estudio
Los materiales de apoyo que les brindamos han sido diseñados y elaborados
cuidadosamente para el estudio en la modalidad “a distancia” para orientar el
estudio del espacio curricular “Estadística” e incluyen:
Cuatro guías didácticas correspondientes a las Unidades 1 a 4, con
las actividades correspondientes.
Material bibliográfico ampliatorio debidamente señalado para su
estudio, subido al campus virtual, que contará con ejercitación
complementaria a la contenida en las guías didácticas.
Si bien se pretende que cada Unidad sea lo más autosuficiente posible,
recuerden que siempre podrán recurrir al profesor/tutor tantas veces como lo
crean conveniente, por la vía virtual o en forma presencial y también podrán
ampliar la información mediante la bibliografía recomendada.
Tecnicatura Superior en Administración de Empresas
Para facilitar el estudio, les proponemos unos íconos que actúan a la manera de
ayudas gráficas del aprendizaje:
ACTIVIDAD OPTATIVA O
SUGERIDA
ACTIVIDAD OBLIGATORIA
ACTIVIDAD OBLIGATORIA DE
CONSTRUCCIÓN GRUPAL EN LA
PLATAFORMA VIRTUAL
BIBLIOGRAFÍA, FUENTES Y
SITIOS WEB RECOMENDADOS
PRESTAR ATENCIÓN
CUESTIONARIO DE
AUTOEVALUACIÓN
3
Orientaciones Bibliográficas
La bibliografía obligatoria correspondiente a Estadística la encontrarán
resumida en la Guía Didáctica correspondiente a cada unidad.
Asimismo, sugerimos prestar atención a las recomendaciones de ejercitación
ampliatoria que pueden hacerse en las guías didácticas.
El material bibliográfico estará a su disposición en el Campus Virtual del
instituto y las películas o videos se ubicarán por medio de links, también en la
plataforma virtual.
Las actividades de aprendizaje están pensadas para que ustedes las
desarrollen en forma autónoma; esto quiere decir que podrán trabajar del modo
que consideren más productivo.
Las actividades permitirán organizar el aprendizaje; ejercitar y consolidar lo
aprendido; repasar lo más destacado de las temáticas tratadas; favorecer la
síntesis; aplicar los conocimientos a la realidad;
Pueden ser:
Actividades
Obligatorias Optativas o sugeridas
Se encuentran a lo largo de la guía
2 instancias de evaluación parcial en
didáctica y se realizan si el
modalidad virtual.
estudiante lo desea. Nuestro consejo
es que las realicen pues ayudan en el
Actividades en el foro virtual. aprendizaje.
1 evaluación final, presencial, Sobre ellas puede consultarse al tutor.
individual de cierre en la sede central.
Tecnicatura Superior en Administración de Empresas
Es muy importante la realización de las actividades obligatorias propuestas y su
entrega al tutor es de riguroso cumplimiento obligatorio y son necesarias para
alcanzar los objetivos de este espacio curricular; de ello dependerá la
retroalimentación del aprendizaje de cada uno de ustedes.
La atención tutorial pretende mantener un canal abierto de comunicación,
ayudar individualmente al que lo necesite, aclarar dudas, orientar en los
problemas que pudieran surgir, motivar, escuchar inquietudes, entre otros.
Ustedes pueden vincularse con el tutor en instancias presenciales a su
pedido, así como por correo electrónico:
[email protected]O por medio de la plataforma virtual:
www.institutoceo.org.ar
O por teléfono/Fax:
4951-7030/7680
¡No se dejen estar!
¡Cumplan con el cronograma que se les
propondrá!
5
Unidad I
“Estadística Descriptiva”
Consideraciones generales:
La unidad I “Estadística Descriptiva” está dividida en 4 clases
siguiendo el siguiente esquema temático:
Clase Desarrollo
N° 1 Introducción. Conceptos básicos + Actividades
N° 2 Distribuciones de frecuencias (parte 1) + Actividades + Foro virtual N° 1
N° 3 Distribuciones de frecuencias (parte 2) + Actividades
N° 4 Gráficos estadísticos + Actividades + Foro Virtual N° 2
Clase N° 1
Introducción:
Cuando se intenta abordar organizadamente algún nuevo tema, es conveniente
aclarar, definir y ponerse de acuerdo con el significado de lo que se va a tratar.
En nuestro caso para ponernos de acuerdo con lo que vamos a entender por
“Estadística”, podemos comenzar por ver lo que nos dice el Diccionario de la
Real Academia Española:
1ra. Acepción: “Censo o recuento de la población, de los recursos naturales e
industriales, del tráfico o de cualquier otra manifestación de un Estado”.
2da Acepción: “Estudio de los hechos morales o físicos del mundo que se
prestan a numeración o recuento y a comparación de las cifras a ellos
referentes”.
Tecnicatura Superior en Administración de Empresas
Por otro lado, la “gente común” entiende por “estadística” (en minúscula), a algún
“resumen numérico expresado en forma de tablas, gráficos o números sueltos,
con los que se intenta mostrar la situación o evolución de algo”.
Si bien estas definiciones e interpretaciones son correctas, no bastan para
describir el moderno concepto del término, ya que se refieren al origen del
significado de la palabra (relativo al Estado), y no cubren lo concerniente a la
Estadística (en mayúscula) como ciencia.
Los métodos estadísticos forman parte de cada paso de una buena
investigación, desde el diseño del estudio, la recolección de los datos, la
organización y el resumen de la información, el análisis, la elaboración de
conclusiones, la discusión de las limitaciones y, por último, el diseño de un
próximo estudio a fin de dar respuesta a las nuevas preguntas que pudieran
surgir.
En cualquiera de las etapas de este proceso puede haber errores. Puede, o no,
ser intencionales. Es posible mentir con estadística, pero es mucho más fácil
mentir sin estadísticas.
No obstante, no resulta simple obtener una única definición de Estadística que
conforme a todos sus adherentes. Algunas de las definiciones más utilizadas son
las siguientes:
Definición Autor
Ciencia de tomar decisiones en presencia de la Freund, J.E. –
incertidumbre Eallis y Roberts
Rama del conocimiento científico que se ocupa del Capelletti C.A.
análisis numérico e interpretación de los resultados
que provienen de experimentos de naturaleza
aleatoria.
Disciplina que investiga la posibilidad de extraer de Cramer, H.
los datos inferencias válidas, elaborando los
métodos mediante los cuales pueden obtenerse
dichas inferencias.
Ciencia de tomar decisiones en base a Sprowls,C.
observaciones
Utilizaremos la palabra estadístico/a con cuatro significados diferentes que,
según el contexto, será fácil distinguir.
1. La estadística como disciplina de estudio. Siempre estará en singular.
2. La estadística o las estadísticas como resultados que presentan
organismos de estadística oficiales como, por ejemplo, el INDEC.
7
3. Un estadístico como un procedimiento para obtener un número a partir
de valores de una encuesta.
4. Un estadístico o estadística como una persona que tiene la estadística
como profesión.
Etapas de un estudio estadístico
La estadística interviene activamente en todas las etapas que componen el
método científico.
Aunque para el método científico no exista una secuencia única, señalamos los
siguientes pasos generales:
Planteo de preguntas,
Planificación y realización de estudios,
Recolección de datos,
Procesamiento de los datos
Análisis de la información,
Obtención de conclusiones.
La Estadística Descriptiva es la parte de la estadística que se dedica a
examinar los datos con el fin de organizarlos, sintetizarlos, reconocer sus
características más relevantes y presentar la información de forma resumida
Describe, analiza y representa un grupo de datos utilizando métodos numéricos
y gráficos que resumen y presentan la información contenida en ellos.
La Estadística Inferencial es el conjunto de métodos que, a partir de una
situación dada, permiten realizar inferencias (estimaciones, comprobaciones,
proyecciones, etc.) sacar conclusiones y tomar decisiones acordes.
Conceptos fundamentales
Los conceptos requieren de palabras específicas para ser identificados.
La estadística tiene su propio vocabulario. Veremos algunos términos básicos,
que volveremos a encontrar más adelante, además, seguiremos incorporando
términos a lo largo de la materia.
Unidades de Análisis Estadístico
Debe entenderse por tales “al objeto de un Estudio Estadístico”. Son aquellas
sobre las que se realizan las observaciones o mediciones, o que responden las
consultas que se realizan. Por ejemplo:
Las Personas: en un censo de población, en una encuesta de opinión, etc.
Las Empresas: en un censo económico, en una encuesta sobre el sistema
de riesgos del trabajo, en un estudio sobre insumos de producción, etc.
Los Países: en un estudio sobre exportaciones agropecuarias, en una
encuesta sobre la natalidad de la población, etc.
Los Objetos: en una producción en serie se podría analizar el estado de
tornillos, lamparitas, etc.
En las Unidades Estadísticas se miden Variables Estadísticas.
Tecnicatura Superior en Administración de Empresas
Variables estadísticas
Las variables son características que pueden cambiar de una unidad de
análisis a otra, como la edad de las personas, la población de cada ciudad, el
porcentaje de alumnos reprobados en una escuela, la longitud de un tornillo, la
duración de una lamparita.
Ejemplos de unidades de análisis y sus posibles variables a considerar:
Unidad de análisis Variables
Personas ⇒ Edad
⇒ Estado Civil
⇒ Cantidad de Hermanos
⇒ Nivel de Estudios alcanzado
Empresas ⇒ Producción (en $ o Tn)
⇒ Rama de Actividad
⇒ Tamaño
⇒ Cantidad de Personal Ocupado
Países ⇒ Exportaciones (en millones de U$S
o Tn)
⇒ Rubro principal de exportaciones
⇒ Nivel de “Riesgo País”
⇒ Cantidad de Países Acreedores
Como puede observarse en los ejemplos de la tabla anterior, estas Variables
pueden ser de características muy diversas, y de acuerdo al tipo de resultado
que pueden tomar, se las puede clasificar de formas muy variadas. La forma de
clasificarlas se incluye a continuación:
Tipos de Variables
Cuantitativas: Discretas: aquellas cuyos resultados
numéricos solo toman valores
Aquellas cuyos resultados se enteros.
expresan en forma numérica (con
cantidades) Ejemplos:
Cantidad de hermanos
Personal ocupado
Cantidad de países acreedores
Cantidad de años cumplidos
9
Continuas: aquellas que,
teóricamente, pueden tomar como
resultado cualquier valor real, dentro
de un intervalo.
Ejemplos:
Edad
Producción
Exportaciones
Cualitativas: Nominales: aquellas cuyos
resultados no expresan dimensión ni
Aquellas cuyos resultados se orden entre las variables
expresan en palabras o no
numéricamente (con cualidades). No Ejemplos:
permiten realizar operaciones Estado Civil
algrebraicas. Rama de actividad
Rubro principal de
exportaciones
Género
Ordinales: aquellas cuyos resultados
expresan dimensión y orden entre las
variables.
Ejemplos:
Nivel de estudios alcanzado,
Nivel de satisfacción con un
servicio
Talle de una prenda de vestir
Para pensar: ¿Cuál es la unidad de análisis si queremos responder a
la pregunta: cómo serán mis compañeros? ¿Cuáles podrían ser las
variables de interés?
Población y muestra
La población es el conjunto que incluye la totalidad de las unidades de
análisis sobre las que se centra el estudio.
Se denomina Población al conjunto de entidades u objetos que satisfacen una
definición común y sobre los que interesa analizar una o más características.
Aquí el término población tiene un significado mucho más amplio que el usual,
ya que puede referirse a personas, objetos, actos, áreas geográficas e incluso al
tiempo. La población debe estar perfectamente definida en el tiempo y en el
espacio. Si, por ejemplo, estamos analizando las escuelas primarias, debemos
Tecnicatura Superior en Administración de Empresas
especificar cuáles y cuándo, por ejemplo “escuelas primarias de CABA, año
2019”. La unidad de análisis y la población siempre deben ser ubicadas en
espacio y tiempo.
Cuando se estudia el comportamiento de una variable en una población hay que
tener en cuenta que ésta normalmente es demasiado grande para poder
abarcarla. Entonces, se toma una muestra formada por miembros
“seleccionados” de la población (individuos o unidades experimentales). La
muestra es un subconjunto de unidades seleccionadas de la población de
interés.
Unidad de análisis
Población
Muestra
El número de objetos que componen la población se denota por “N”.
En general si el tamaño N de la población es muy grande, el tiempo y
el costo de observar cada uno de los elementos es muy alto. Estas razones,
entre otras, nos obligan a restringirnos y observar un subconjunto (una parte)
de la población.
El número de objetos que componen este subconjunto es denominado
tamaño muestral y usualmente se denota por n.
Muestra representativa
Una buena muestra debe ser representativa de la población. Esto significa, que
todas las características importantes de la población tienen que estar en la
misma proporción que en la población.
¡Hasta acá llegamos con nuestra primera clase!
¡Y recuerden que estamos a disposición para aclarar sus
dudas y para responder sus consultas!
11
Actividad Obligatoria Clase N° 1:
1. Clasificar las siguientes variables según el tipo
al que pertenezcan.
a) El grupo sanguíneo
b) Número de hijos
c) Nacionalidad
d) Intensidad de dolor
e) Peso
f) Número de sesiones de un tratamiento
g) Número de hojas de un árbol
h) Peso de las semillas recolectadas por planta
i) Grado de satisfacción al comprar un producto
j) Sexo
k) Longitud del tallo
l) Nº de huevos por gallina
2. Indicar en cada caso cuál es la unidad de análisis y variables estudiadas.
Clasificarlas.
a) En el peaje de una autopista, se está realizando un estudio sobre el color
de los coches que pasan, su número de ocupantes y la velocidad máxima
a la que circulan.
b) Se desea estudiar la opinión del estudiante del Colegio ABC sobre la
calidad del servicio de fotocopiado en este año.
c) Se desea investigar la relación entre los estudiantes becados y su
rendimiento académico.
d) Se desea conocer la opinión de los ciudadanos del país ante el aumento
en la canasta básica de los alimentos del 2013.
e) Un colegio desea conocer la condición socioeconómica de todos sus
alumnos, para lo cual se decidió realizar una encuesta a ellos.
Tecnicatura Superior en Administración de Empresas
Clase N° 2
Tablas de distribución de frecuencias
La distribución de frecuencias es la representación estructurada, en forma de
tabla, de la información que se ha recogido sobre la variable en estudio.
Por ejemplo, en el Censo de Población de la República Argentina del año 2010,
una de las preguntas fue: ¿Sabe leer y escribir? Observemos los resultados
obtenidos, a partir de quienes respondieron:
Sabe leer y escribir Cantidad de personas Porcentaje (%)
Sí 35.500.411 93,21
No 2.586.973 6,79
Total 38.087.384 100,00
Fuente: INDEC. Censo de Población, Hogares y Viviendas 2010.
En una distribución de frecuencias, se cuenta la cantidad de unidades que
se corresponde con cada categoría de la variable.
Notación:
xi son los distintos valores que puede tomar la variable. En el ejemplo, x1=sí,
x2=no.
fa (frecuencia absoluta simple) indica la cantidad de veces que aparece un
valor de la variable, es decir el número de veces que se repite cada valor. En
el ejemplo, la columna “Cantidad de personas” corresponde a la frecuencia
absoluta simple fa (¡en minúscula!)
Fa (frecuencia absoluta acumulada) es la cantidad de datos hasta un cierto
valor de la variable, es decir es el número de veces que se repiten los valores
iguales o menores de la variable. Sólo tiene sentido en las variables cuyos
valores pueden ser ordenados. En nuestro ejemplo, la variable es cualitativa
13
nominal, por lo que no admite un orden y por ello, la frecuencia absoluta
acumulada no tiene sentido.
fr (frecuencia relativa simple) indica la parte sobre el total, en el que se repite
dicho valor. Para calcularla se divide la frecuencia absoluta sobre el total de la
población relevada.
fr% (frecuencia relativa porcentual) indica el porcentaje de veces que se
repite un valor de la variable. Se calcula multiplicando por 100 al valor de la
frecuencia relativa simple. En el ejemplo, es la columna de “Porcentaje (%)”.
Fr (frecuencia relativa acumulada) es la parte del total de veces que se
repiten valores iguales o menores de la variable.
Fr% (frecuencia relativa acumulada porcentual) es el porcentaje de veces
que se repiten valores iguales o menores de la variable.
El encabezado de la tabla es el siguiente.
Las distribuciones de frecuencias tienen ciertas diferencias según qué tipo de
variable representen. Veamos caso por caso.
Primer Caso: Observaciones de una variable Cualitativa. En este caso
sólo se necesita agrupar los datos en sus categorías.
Ejemplo.
En un grupo de alumnos se hizo un relevamiento de diferentes variables. Una de
ellas fue el sexo (para simplificar utilizaremos categorías dicotómicas). La
variable sexo es cualitativa nominal, por lo que no tiene sentido el orden de sus
categorías, por ello no consideramos las columnas de frecuencias acumuladas.
Las respuestas de los 20 alumnos fueron las siguientes.
Femenino – masculino – femenino – femenino – femenino – femenino –
masculino – masculino – femenino – femenino – femenino – masculino –
masculino – masculino – masculino – masculino – femenino – femenino–
femenino – femenino.
Encontramos la respuesta femenino 12 veces y masculino, 8.
La tabla de frecuencias queda definida de la siguiente manera.
Sexo fa fr fr%
Femenino 12 0,6 60%
Tecnicatura Superior en Administración de Empresas
Masculino 8 0,4 40%
Total 20 1 100%
Para calcular la frecuencia relativa de la categoría “Femenino”, se divide el total
de la categoría sobre el total absoluto, es decir, 12/20=0,6.
La suma de las frecuencias relativas siempre debe sumar 1, pues representa el
entero, que en este caso está formado por 20 personas.
Para calcular las frecuencias relativas porcentuales, se multiplica por 100 los
valores de la columna de frecuencia relativa. La suma es el 100%.
Segundo Caso: Observaciones provenientes de una variable
Cuantitativa discreta con pocos valores (pocas categorías en la variable).
En este caso, similar a lo anterior, sólo se necesita agrupar los datos iguales. En
este caso, las frecuencias acumuladas sí tienen sentido pues las categorías
admiten orden.
Ejemplo.
A los 20 alumnos del ejemplo anterior, se les preguntó cuántos hermanos tienen.
Las respuestas fueron las siguientes.
3 0 1 4 3 1 3 2 2 2
1 2 0 3 4 1 1 2 4 2
Variable Frecuencias Frecuencias relativas
absolutas
Cantidad fa Fa fr Fr fr% Fr%
de
hermanos
0 2 2 0,10 0,10 10% 10%
1 5 7 0,25 0,35 25% 35%
2 6 13 0,30 0,65 30% 65%
3 4 17 0,20 0,85 20% 85%
4 3 20 0,15 1 15% 100%
Total 20 1
En este ejemplo, lo nuevo son las columnas de frecuencias acumuladas. Lo
primero que hay que notar es que esta columna se forma sumando las categorías
anteriores.
15
Variable Frecuencias absolutas
Cantidad fa Fa
de
hermanos
0 2 2
1 5 5+2=7
2 6 5+2+6=13
3 4 5+2+6+4=17
4 3 5+2+6+4+3=20
Total 20
Es importante interpretar la tabla en forma correcta. Por ejemplo, el número 6
señalado en celeste indica que hay 6 alumnos que tienen exactamente 2
hermanos. En cambio, en número 13 señalado en violeta se lee como “hay 13
alumnos que tienen 2 hermanos o menos”.
En la tabla anterior, el número 0,85 representa que la proporción de alumnos con
3 hermanos o menos es de 0,85. También se puede leer como “el 85% de los
alumnos poseen 3 hermanos o menos”.
¡Hasta acá llegamos con nuestra segunda clase!
¡Y recuerden que estamos a disposición para aclarar sus
dudas y para responder sus consultas!
Actividad Obligatoria Clase N° 2:
Se quiere estudiar el nivel de educación de las madres de
recién nacidos en cierta ciudad, para ello se toma una
muestra al azar de 80 madres y se les pregunta el nivel de
instrucción alcanzado. Los datos están codificados de la
siguiente manera:
Sin instrucción = 1
Primario incompleto = 2
Primario completo = 3
Secundario incompleto = 4
Secundario completo = 5
Universitario o superior incompleto = 6
Universitario o superior completo = 7
Tabla: Nivel de instrucción de 80 madres encuestadas
Tecnicatura Superior en Administración de Empresas
3 5 3 1 4 3 7 5
5 3 4 3 3 6 2 5
1 4 4 4 4 5 4 4
3 2 3 3 3 4 6 5
3 2 2 3 4 3 3 7
3 3 3 5 4 5 6 4
2 6 4 5 3 5 3 4
2 5 2 2 5 7 5 5
a) Completar la tabla de distribución de frecuencias
b) ¿Qué representa el número 23 en la columna de frecuencia absoluta simple
(fa) de la tabla de distribución de frecuencias?
c) Interpretar por escrito que representa el valor 71 de la columna de frecuencias
acumuladas.
d) Considerar tres valores porcentuales diferentes e interpretarlos.
e) ¿Cuántas madres tiene como mínimo un nivel secundario completo?
f) ¿Qué preguntas podrían realizar a partir de los datos de la tabla? (dar tres
ejemplos)
Foro virtual N° 1 obligatorio:
Nos encontramos en el foro virtual y recuerden…
¡Cualquier pregunta, consulta o dificultad no duden en contactarse con
sus tutores!
17
Clase N° 3
Tablas de distribución de frecuencias
Tercer Caso: Tabla de distribución de Frecuencias para variables
continuas o discretas con muchos valores.
Veamos un ejemplo.
En el Censo de Población de la República Argentina del año 2010, una de las
preguntas fue ¿Cuántos años tiene? (en años cumplidos). La variable EDAD es
cuantitativa continua, puesto que el tiempo vivido por una persona puede ser
31 años, 5 meses, 3 días, 5 hs. En cambio, si la pregunta es en años cumplidos,
la respuesta sería 31 años; en ese caso la variable es cuantitativa discreta.
La edad en años cumplidos es una variable que puede tomar muchos valores
distintos, desde 0 (cero) hasta ¿100?, tal vez más… Si colocamos un valor etario
en cada fila de tabla, ésta requeriría de un mínimo de 100 renglones, lo cual no
es muy práctico para ningún estudio estadístico. Por ello, se utilizan intervalos
de números para agrupar muchos valores diferentes en un mismo rango.
Grupo de edad (en años cumplidos) fa
[0 𝑎 15) 10.222.317
[15 𝑎 65) 25.790.131
65 y más 4.104.648
Total 40.117.096
Fuente: INDEC. Censo de población, hogares y viviendas 2010.
¿Cómo se interpretan estos grupos de edad?
● [0 a 15) corresponde a las edades en años cumplidos mayores o iguales a 0 y
menores a 15 años.
● [15 a 65) corresponde a las edades en años cumplidos mayores o iguales a 15
y menores a 65 años.
● El grupo 65 y más, corresponde a las edades iguales o mayores a 65 años.
¿Qué quiere decir que los intervalos son cerrados a izquierda y abiertos a
derecha?
Tecnicatura Superior en Administración de Empresas
● El intervalo [0 a 15) incluye al 0 (cerrado a izquierda) pero no incluye al 15
(abierto a derecha).
● El intervalo [15 a 65) incluye al 15 (cerrado a izquierda) pero no incluye al 65
(abierto a derecha).
Siempre que utilicemos intervalos de números reales, éstos serán cerrados
a izquierda y abiertos a derecha.
Pero, ¿cómo armamos los intervalos?
El número de intervalos recomendable es aquel que permita presentar los datos
de manera resumida. La utilización de demasiados intervalos difiere poco de la
tabulación original de los datos, y un número demasiado reducido puede
enmascarar información esencial. Los intervalos que se construyan deben ser
mutuamente excluyentes, de modo de evitar la mala clasificación de los datos.
Es conveniente para la determinación de los intervalos:
1. Ordenar los valores de menor a mayor e identificar el dato correspondiente al
valor máximo (xmáx) y al valor mínimo (xmín).
2. Calcular el Rango, es decir, la diferencia entre el máximo y el mínimo:
R= xmáx - xmáx
3. Dividir esta diferencia por el número de intervalos que se desea obtener, para
identificar así la amplitud de cada intervalo.
4. Armar los intervalos considerando el siguiente ejemplo:
Sea la variable edad en años cumplidos, que toma los siguientes valores:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26,
20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Para armar 5 intervalos, primero ordenar los valores de menor a mayor:
3 7 11 13 13 15 15 17 20 22 24 25 26 27 28 28 29 31 32 32 33 34 34 34 35 35
36 36 37 38 38 38 39 39 41 42 43 44 47 48
Luego obtener:
xmín= 3 años xmáx= 48 años R= 48-3= 45 años
Como el número de intervalos es 5:
Amplitud= Rango/cantidad de intervalos=45 años/5= 9 años.
Partimos del xmín (3) y le sumamos la amplitud para obtener el otro extremo
(3+9=12) resulta: [3 a 12).
19
Para armar el segundo intervalo, tomamos el extremo superior del primero (12)
y le sumamos la amplitud (12+9=21), resultando: [12 a 21). Repetimos el
procedimiento y obtenemos: [21 a 30), [30 a 39) y [39 a 48].
Finalmente:
Grupos de edad fa Fa fr Fr fr% Fr%
[3; 12)
[12; 21)
[21; 30)
[30; 39)
[39; 48)
Total
Luego, se completa con las frecuencias correspondientes:
Grupos de edad fa Fa fr Fr fr% Fr%
[3; 12) 3 3 0,075 0,075 7,5 7,5
[12; 21) 6 9 0,15 0,225 15 22,5
[21; 30) 8 17 0,2 0,425 20 42,5
[30; 39) 15 32 0,375 0,8 37,5 80
[39; 48) 8 40 0,2 1 20 100
Total 40 1 100
Vemos algunos ejemplos de interpretación de los datos del cuadro (las celdas
señaladas en celeste)
Hay 8 personas que tienen 21 años o más y menos de 30.
32 personas tienen menos de 39 años
La proporción de personas que tienen entre 12 y 21 años es de 0,15. Lo
cual es equivalente a decir que el 15% de las personas encuestadas
tienen entre 12 y 21 años.
La proporción de personas menores de 39 años es de 0,8, es decir, que
el 80% de los encuestados tiene esa edad.
La variable EDAD es continua (como hemos aclarado en la clase 1).
En este caso, la variable es EDAD EN AÑOS CUMPLIDOS que es discreta,
pues las respuestas posibles son números enteros. Como se utilizaron los datos
agrupados en intervalos, el tratamiento que le damos a la variable es el mismo
que a una continua.
Las variables continuas se grafican en histogramas (profundizaremos en este
tema en la próxima clase). Vemos los gráficos que corresponden a este ejemplo:
Tecnicatura Superior en Administración de Empresas
Histograma
Cantidad de personas según su edad
120%
100%
cantidad de personas
80%
60%
40%
20%
0%
A B AB O
Edad
Histograma con polígono de frecuencias
21
Histograma de frecuencias acumuladas
Cantidad de personas según su edad
120%
100%
cantidad de personas
80%
60%
40%
20%
0%
A B AB O
Edad
Histograma de frecuencias acumuladas y polígono de frecuencias
acumuladas (ojiva)
¡Hasta acá llegamos con nuestra tercera clase!
¡Recuerden que estamos a disposición para aclarar sus
dudas y para responder sus consultas!
Tecnicatura Superior en Administración de Empresas
Actividad Obligatoria Clase N° 3:
Los siguientes datos corresponden a las alturas, en
centímetros, de un grupo de estudiantes
secundarios:
174,3 - 160,2 - 172,0 - 175,9 - 164,1 - 173,5 - 166,0 - 171,7 - 160,2 - 177,4 -
168,1 - 174,8 - 171,4 - 169,0 - 165,7 - 173,1 - 169,4 - 183,8 - 175,5 - 165,3 -
167,2 - 168,6 - 178,5 - 175,1 - 171,3 - 174,5 - 172,5 - 179,6 - 173,8 - 166,9 -
172,8 - 170,8 - 167,5 - 174,9 - 170,3.
a) Ordenar los datos anteriores en una distribución de frecuencias, utilizando 6
intervalos de 4 cm. de amplitud y comenzando en 160 cm.
b) Calcular las frecuencias absolutas acumuladas, las frecuencias relativas
simples y las frecuencias relativas acumuladas.
c) Calcular el porcentaje de estudiantes que mide:
c.1) 168 cm o más pero menos de 172 cm.
c.2) 168 cm o más pero menos de 180 cm.
c.3) menos de 168 cm
d) Confeccionar el histograma y polígono de frecuencias.
Clase N° 4
Cuadros y gráficos estadísticos
Los datos recolectados pueden presentarse estadísticamente de varias formas:
dentro de un texto, en una tabla o cuadro y en un gráfico. Estos últimos son
útiles para resumir información, realizar comparaciones visuales sencillas
y presentar los datos de manera acotada. Al presentar los datos en un texto
se puede realizar un análisis más profundo, extraer conclusiones y destacar lo
que se considera más relevante.
23
En este capítulo estudiaremos cómo confeccionar correctamente tablas y
gráficos estadísticos.
Tablas o cuadros estadísticos
Consiste en presentar la información ordenada en filas y columnas de tal
manera que la misma se comprensible y que permita tener un panorama general
de la situación. Todo cuadro debe incluir las siguientes partes:
Título: debe sintetizar el contenido del cuadro y responder a las preguntas
¿Cuáles son los datos contenidos en el cuadro? ¿Dónde fueron
recopilados? ¿Cuándo ocurrieron los eventos que dieron origen a los
datos? ¿Cómo están clasificados?
Nota de encabezado (optativo): para aclarar algún aspecto general del
cuadro. Se ubica debajo del título.
Columna matriz o principal: corresponde usualmente a la variable
principal o a una de ellas.
Encabezado: corresponde al título de las columnas.
Cuerpo del cuadro: corresponde al contenido de los datos estadísticos.
Nota al pie (optativo): se utiliza para aclarar algún aspecto específico.
Fuente: se consigna el origen de los datos.
Gráficos estadísticos
Tecnicatura Superior en Administración de Empresas
Se denominan gráficos a aquellas imágenes que, combinando la utilización de
colores, puntos, líneas, símbolos, números, texto y un sistema de referencia
(coordenadas), permiten presentar información. La utilidad de los gráficos es
doble, ya que pueden servir no sólo como sustituto a las tablas, sino que
constituyen por sí mismos una poderosa herramienta para el análisis de los
datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir
la información, sino también para visualizarla y analizarla. En un gráfico
estadístico se puede distinguir la siguiente estructura.
Gráficos para variables cualitativas:
Diagramas de barras: se representan en el eje de abscisas (x) las modalidades
o categorías de la variable cualitativa, y en el eje de ordenadas (y) las frecuencias
absolutas o relativas.
Por ejemplo: Se tiene el porcentaje de personas de la localidad de los Álamos
en el 2013, que pertenecen a los distintos grupos sanguíneos, son los siguientes:
B: 7%; A: 44%; AB: 3%; 0: 46%.
25
Distribución del Grupo Sanguíneo de la Población
de Los Álamos. Año 2013. En %.
120%
100%
80%
Porcentaje
60%
40%
20%
0%
A B AB O
Grupo sanguíneo
Fuente: Datos del Sistema de Salud Municipal
Barras segmentadas: Sirven para combinar los datos de dos variables. Por
ejemplo, si queremos comparar la distribución de personas con cada grupo
sanguíneo en diferentes años. En este caso una variable es cualitativa y la otra
es cuantitativa discreta.
Distribución del Grupo Sanguíneo de la
Población de Los Álamos. Años 2013 y 2019.
En %.
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
2013 2019
A B AB O
Diagramas de sectores (también llamados tortas): Se divide un círculo en
tantas porciones como clases o categorías existan, de modo que a cada clase le
corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa.
Para los datos del ejemplo anterior se muestra el gráfico de torta
correspondiente.
Tecnicatura Superior en Administración de Empresas
Distribución del Grupo Sanguíneo de la
Población de Los Álamos. Año 2013. En %.
45% 44%
3%8%
A B AB O
Fuente: Datos del Sistema de Salud Municipal
¿Cómo realizamos este gráfico?
Para realizar un gráfico circular, primero se dibuja un círculo. Los 360°
representan el total, en este caso todas las personas que vivían en Los Álamos
en 2013. Cada sector dentro del círculo representa una categoría con el ángulo
proporcional a su tamaño (cantidad o porcentaje). El sector correspondiente a la
categoría “Grupo A” tendrá un ángulo que corresponda al 45% de 360°, para
calcular ese porcentaje se resuelve el siguiente cálculo:
45% . 360°
= 162°
100%
Ese cálculo se repite para cada categoría de la variable.
Gráficos para variables cuantitativas:
Existen diferentes gráficos, según el tipo de variable: discreta o continua. En ellos
se pueden representar tanto frecuencias absolutas como relativas.
Diagramas de Bastones para variables discretas: Se deja un hueco entre
barras para indicar los valores que no son posibles (por ejemplo, números
decimales de hijos).
27
¿Cómo realizamos el gráfico? Para realizar un gráfico de bastones, se dibujan
dos ejes. En el eje horizontal, se indican los valores de la variable. En el eje
vertical, se indica la frecuencia absoluta. El alto del bastón coincide con la
frecuencia absoluta de cada valor de la variable.
Histogramas para variables continuas
En el eje horizontal se indican los intervalos en los que se categorizó la variable.
Las barras deben estar pegadas por ser una variable continua. La altura de cada
barra indica la frecuencia (puede ser absoluta, relativa o porcentual).
El área que hay bajo el histograma, entre dos puntos cualesquiera, indica la
cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Ejemplo
Cantidad de chicos según su altura
10
9
8
Cantidad de chicos
7
6
5
4
3
2
1
0
1,45 a 1,50 a 1,55 a 1,60 a 1,65 a 1,70 a 1,75 a 1,80 a 1,85 a
1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90
Altura
El polígono de frecuencias se obtiene uniendo los puntos medios de los
intervalos.
Tecnicatura Superior en Administración de Empresas
La siguiente tabla resume las formas de organizar los datos de una variable
cuantitativa. Recuerden que las variables discretas que toman muchos
valores (como el ejemplo expuesto en esta clase) se tratan como una variable
continua.
Tipos de variables Tabla de frecuencias Tipo de gráfico
Discretas: Simples: fa fr fr% Bastones
Surgen de un conteo Acumuladas: Fa Fr Fr% Escalones
Continuas: Simples: fa fr fr% Histograma y polígono
de frecuencias
Surgen de una medición
Acumuladas: Fa Fr Fr% Histrograma acumulado
y Ojiva o polígono de
frecuencias acumuladas
¡Hasta acá llegamos con nuestra cuarta clase y también se
termina la Unidad I!
29
¡Recuerden que estamos a disposición para aclarar sus
dudas y para responder sus consultas!
Actividad Obligatoria Clase N° 4:
1) El departamento de personal está
implementando un sistema de control de ausentismo
y para mostrar los primeros resultados obtenidos, informa la cantidad diaria de
ausentes registrados en las dos últimas semanas de marzo de 2013 en el sector
de Administración, donde trabaja aproximadamente la misma cantidad de
hombres que de mujeres. Los datos informados son los siguientes:
a) De acuerdo a esta tabla ¿cuál de los siguientes tres gráficos considera que
explica mejor la situación? Fundamentar.
b) Indicar cuáles son los elementos faltantes en cada gráfico y completarlos.
GRÁFICO LINEAL
Ausentes diarios en el Sector administrativo de la empresa Sur S.A. del 18 al 29
de marzo de 2012.
Fuente: Registro del Dto. De Personal.
Tecnicatura Superior en Administración de Empresas
GRÁFICO LINEAL DE PARTES COMPONENTES
GRÁFICO DE LINEAS CRUZADAS
2) El sector Ventas que cuenta con tres equipos de vendedores desea fomentar
la competitividad entre los mismos para incrementar las ventas, que están
disminuyendo debido a la situación económica general. Al respecto informa que,
según los datos registrados en sus archivos, en marzo de 2013 el monto vendido
por el equipo de vendedores A ascendió a $36.000; el del equipo B fue de
$120.000 y el del equipo C fue de $ 132.000.
a) Con la información suministrada, elaborar un cuadro estadístico.
31
b) ¿Cuáles de los siguientes gráficos mencionados, considera que explica mejor
la situación? Construir el gráfico seleccionado
Foro virtual N° 2 obligatorio:
Nos encontramos en el foro virtual y recuerden…
¡Cualquier pregunta, consulta o dificultad no duden en contactarse con
sus tutores!
¡¡¡… Los esperamos en la Unidad II…!!!