¿Qué es la Estadística? Concepto de Unidad de Análisis y Variable. Tipos de variables.
Concepto de
Población y Muestra.
1. ¿Qué es la estadística? Definir estadística a partir de la puesta en común por lo que cada uno entiende
por estadística.
2. Concepto de Unidad de Análisis y Variable. Tipos de variables.
Entender el concepto de variables a partir de una encuesta entre los alumnos.
● ENCUESTA: El siguiente cuestionario busca recabar información general sobre los alumnos de esta
clase.
Nombre:___________________
Edad (en años cumplidos):_________________
Sexo: (M) (F):_______
Estatura (en centímetros.):_______ Peso (en Kilogramos):_________
Número de hermanos:________
Lugar de nacimiento (Localidad y Partido):______________
Número de horas promedio que dedica al estudio:_______
Asignatura que más le agrada (Matemática, Lengua, Historia, geografía, Educación
física):_______________________
El mundo presenta una enorme variabilidad. Por ejemplo, los seres vivos son distintos entre sí, y aportan
diversidad a la población. Muchas son las características que pueden variar entre individuos (en el ser humano:
altura, color de pelo, sexo, edad, lugar de nacimiento, entre muchos otros). Los datos que representan
mediciones u observaciones de ciertas características de interés se llaman variables, y se las puede clasificar
como se indica en la siguiente tabla:
Variables cualitativas Nominales: Sus valores no se pueden ordenar. Por ejemplo:
No se pueden medir sexo (F o M), grupo sanguíneo (A, B, AB, 0, entre otros),
numéricamente. No religión, nacionalidad, etc.
permiten realizar Ordinales: Sus valores se pueden ordenar. Por ejemplo:
operaciones algebraicas. mejoría de un paciente ante un tratamiento (muy mejorado,
Pueden ser nominales u moderado, poco mejorado, sin mejoras), grado de
ordinales. satisfacción (muy, medianamente, poco, nada satisfecho),
intensidad del dolor, etc.
Variables cuantitativas Discretas: sólo pueden tomar valores enteros (1, 2, 25, -12,
Tienen valor numérico etc.). Por ejemplo: número de hijos (puede ser 1, 2, 3, etc.,
(edad, altura, ingresos pero nunca podrá ser 3,5).
mensuales). Se pueden Continuas: pueden tomar cualquier valor real dentro de un
clasificar en discretas y intervalo. Por ejemplo, la altura de las personas puede ser
continuas. 1,65 m; 1,70 m; 1,90 m; etc.
● ACTIVIDADES:
1. Tipos de variables numéricas:
Clasificar las siguientes variables, según el tipo al que pertenezcan. Categorizarlas.
a) El grupo sanguíneo
b) Número de hijos
c) Nacionalidad
d) Intensidad de dolor
e) Peso
f) Número de sesiones de un tratamiento
g) Número de hojas de un árbol
h) Peso de las semillas recolectadas por planta
i) Grado de satisfacción al comprar un producto
j) Sexo
k) Longitud del tallo
l) Nº de huevos por gallina
Respuesta: Cualitativas: Nominales: a, c, j; Ordinales: d, i. Cuantitativas: Discretas: b, f, g, l; Continuas: d,
h, k.
2. Indica en cada caso cuál es la unidad de análisis y variables estudiadas. Clasificarlas.
a) En el peaje de una autopista, se está realizando un estudio sobre el color de los coches que pasan, su
número de ocupantes y la velocidad máxima a la que circulan.
b) Se desea estudiar la opinión del estudiante del Colegio ABC sobre la calidad del servicio de fotocopiado
en este año.
c) Se desea investigar la relación entre los estudiantes becados y su rendimiento académico.
d) Se desea conocer la opinión de los ciudadanos del país ante el aumento en la canasta básica de los
alimentos del 2004.
e) El Seguro Social necesita conocer la proporción de niños que ocupan una segunda dosis de vacunas
durante el curso lectivo del 2004, para preparar una campaña masiva por todo el país.
f) Un colegio desea conocer la condición socioeconómica de todos sus alumnos, para lo cual se decidió
pasar una encuesta a estos.
3. Concepto de Población y Muestra.
Cuando se estudia el comportamiento de una variable en una población (conjunto sobre el que se desea
obtener conclusiones o hacer inferencias) hay que tener en cuenta que ésta normalmente es demasiado
grande para poder abarcarla. Entonces, se toma una muestra formada por miembros “seleccionados” de la
población (individuos o unidades experimentales) y que es suficientemente representativa (en cantidad y
diversidad).
Glosario:
▪ Estadística es la ciencia de recolectar, describir, organizar e interpretar datos para transformarlos en
información, para la toma más eficiente de decisiones. Esta información debe ser clara y precisa
especialmente en la presentación de datos en forma de tablas y gráficas.
▪ La estadística descriptiva comprende cualquier actividad relacionada con los datos y está diseñada para
resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que
vaya más allá de los datos, como tales. Describe, analiza y representa un grupo de datos utilizando
métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
▪ La estadística inferencial es el conjunto de métodos que a partir de una situación dada, permiten realizar
inferencias (estimaciones, comprobaciones, proyecciones, etc.) sacar conclusiones y tomar decisiones
acordes.
▪ Variable: característica de interés que se quiere investigar o estudiar, sobre cada elemento individual de
una población o muestra.
▪ Población. Se denomina población al conjunto total de objetos o individuos de interés en estudio.
▪ A cada elemento de la población se le llama individuo o unidad de análisis. El tamaño de la población
es el número de unidades que la conforman.
▪ El número de objetos o individuos que componen la población se denota por N.
▪ En general si el tamaño N de la población es muy grande, el tiempo y el costo de observar cada uno de
los elementos es muy alto. Estas razones, entre otras, nos obligan a restringirnos a observar un
subconjunto (una parte) de la población.
▪ Muestra: Se denomina muestra a un subconjunto de unidades seleccionadas de la población de interés.
▪ El número de objetos o individuos que componen la muestra es denominado tamaño muestra y
usualmente se denota por n.
¿Cómo se analizan los datos? Tabla de distribución de Frecuencias para variables cualitativas y discretas.
Cuando se toman datos de una muestra, éstos son inicialmente compilados en bases de datos (tablas de
frecuencias), para luego ser presentados en forma gráfica. Esto ayuda a visualizar e interpretar la variación de
los datos.
1. Distribución de frecuencias.
La distribución de frecuencia es la representación estructurada, en forma de tabla, de la información que se ha
recogido sobre la variable en estudio, como se muestra en la siguiente tabla, en donde X son los distintos
valores que puede tomar la variable, n es el número de veces que se repite cada valor, y f es el porcentaje (en
relación con el total) en el que se repite dicho valor.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Porcentual %
X1 n1 n1 f1 = n1 / n f1 . 100%
X2 n2 n1 + n2 f2 = n2 / n f2 . 100%
... ... ... ... ...
n1 + n2 +..+
Xn-1 nn-1 fn-1 = nn-1 / n fn-1 . 100%
nn-1
Xn nn ∑ n= n fn = nn / n fn. 100%
Total n 1 100%
Ejemplos:
a) Primer Caso: Observaciones de una variable Cualitativa. En este caso sólo se necesita agrupar los datos en
sus categorías.
● Realizar la tabla de Frecuencias de la variable “Sexo” proveniente de la encuesta realizada en el encuentro1.
● Se quiere estudiar el nivel de educación de las madres de recién nacidos en cierta ciudad, para ello se toma
una muestra al azar de 80 madres y se les pregunta el nivel de instrucción alcanzado.
Los datos están codificados de la siguiente manera:
Sin instrucción=1, Primaria incompleta=2, Primaria completa=3, [Link]=4, Sec. completa=5, Univ.
o superior incompleta= 6, Univ. o superior completa=7. Los datos se muestran en la siguiente tabla.
Agrupando los datos según su categoría se obtiene la distribución de frecuencias para esta variable.
Distribución de Frecuencias para el Nivel de Instrucción de la Madre de recién nacidos de cierta ciudad.
Variable Frecuencias absolutas Frecuencias relativas
Nivel de Instrucción
Simple Acumulada Simple Porcentual %
de la madre
Sin instrucción
Primaria incompleta
Primaria completa
Secundaria
incompleta
Secundaria completa
Sup o univ.
incompleta
Sup o univ completa
Total
b) Segundo caso: Observaciones provenientes de una variable Cuantitativa discreta con pocos valores. En este
caso, similar a lo anterior, sólo se necesita agrupar los datos iguales.
● Realizar la distribución de frecuencias de la variable “Cantidad de hermanos” proveniente de la
encuesta realizada en el encuentro1.
● Se desea estudiar la distribución de la cantidad de miembros de una familia de cierta zona. Se toma una
muestra al azar de 80 familias y se registra el número de miembros.
Distribución de Frecuencias del Número de Miembros de Cierta Zona.
Variable Frecuencias absolutas Frecuencias relativas
Número de Miembros Simple Acumulada Simple Simple%
1
2
3
4
5
6
7
8
10
Total
Tabla de distribución de Frecuencias para variables continúas.
c) Tercer Caso: Observaciones de una variable Cuantitativa Continua (o Discreta con muchos valores) En este
caso existe la necesidad de construir las clases. Para ello se subdivide el rango de datos en sub-intervalos.
● Realizar la tabla de distribución de frecuencias de la variable “Edad” proveniente de la encuesta
realizada en el encuentro1.
● Se desea estudiar el peso de los recién nacidos en un cierto periodo en una ciudad. Se toma una muestra
al azar de 80 recién nacidos y se registra su peso al nacer, los datos se muestran en la siguiente tabla:
Distribución de frecuencias del peso de los recién nacidos
Variable Frecuencias absolutas Frecuencias relativas
Clases Simple Acumulada Simple Simple%
900 a 1300
1300 a 1700
1700 a 2100
2100 a 2500
2500 a 2900
2900 a 3300
3300 a 3700
3700 a 4100
4100 a 4500
45000 a
4900
Total
Los siguientes datos corresponden a las alturas en centímetros de un grupo de estudiantes secundarios:
174,3 160,2 172,0 175,9 164,1 173,5 166,0 171,7 160,2 177,4 168,1 174,8 171,4 169,0 165,7 173,1
169,4 183,8 175,5 165,3 167,2 168,6 178,5 175,1 171,3 174,5 172,5 179,6 173,8 166,9 172,8 170,8
167,5 174,9 170,3
1) Ordenar los datos anteriores en una distribución de frecuencias con intervalos. (Utilizar 6 intervalos
de 4cm. de amplitud comenzando en 160cm.)
2) Calcular las frecuencias absolutas acumuladas, las frecuencias relativas simples y las frecuencias
relativas acumula-das.
3) Calcular el porcentaje de estudiantes que mide:
3.a) entre 168cm. y 172cm.
3.b) entre 168cm. y 182cm.
3.c) menos de 168cm.
Distribución de frecuencias. Actividades.
1) En cada día del mes de enero, en un camping hubo la siguiente cantidad de turistas: 12, 14, 17, 16, 19, 15,
15, 21, 24, 26, 28, 24, 25, 26, 20, 21, 34, 35, 33, 32, 34, 38, 40, 43, 41, 45, 50, 53, 58. Construye una tabla
de frecuencias para estos datos.
2) En un curso de Economía se ha tomado un examen consistente en 12 preguntas. Para aprobar el examen los
alumnos deben tener como mínimo 6 respuestas correctas. A continuación se detalla la cantidad de
respuestas correctas obtenidas por cada alumno: 4 7 5 6 8 3 11 7 6 2 6 7 10 6 5 5 5 8 9 5 4 9 12 4 4 3 6 5 8 5
7 6.
a) Ordenar los datos anteriores en una distribución de frecuencias.
b) Calcular las frecuencias absolutas acumuladas, las frecuencias relativas simples y las frecuencias
relativas acumuladas.
c) Calcular el porcentaje de alumnos aprobados.
d) Calcular el porcentaje de alumnos con más de 7 respuestas correctas.
e) ¿Qué porcentaje de alumnos aprobados contestaron correctamente más de 7 preguntas?
RESPUESTA: 56,25% ; 25% ; 44,44%
3) Los salarios mensuales de los empleados de la empresa BIT S.R.L., tienen la siguiente distribución:
A partir del próximo mes se retendrán impuestos a los salarios que superen los $1.600 mensuales.
Determinar el porcentaje de empleados que se verán afectados por tal retención.
4) Debido al incremento de los reclamos y quejas de los clientes, el jefe de producción de la fábrica ALFA
S.A. deci-de controlar la calidad de todas las unidades producidas el día anterior. La causa de la mayoría de
los reclamos es la elevada cantidad de unidades que deben desecharse porque su longitud cae fuera de los
límites de tolerancia. La longitud especificada para estas unidades es de 0,99cm., con una tolerancia de
0,09cm., es decir que para que una unidad se considere dentro de los límites de tolerancia, debe medir entre
0,90cm. y 1,08cm. Los resultados obtenidos al controlar la longitud de las unidades producidas ayer, en cada
uno de los dos turnos de trabajo de la fábrica, se vuelcan en la siguiente tabla:
a) Determinar el porcentaje de unidades desechadas producidas en:
a.1) el turno mañana.
a.2) el turno tarde.
a.3) toda la fábrica.
(Unidad desechada: unidad cuya longitud está fuera de los límites de tolerancia)
b) ¿Qué porcentaje de las unidades cuya longitud está comprendida dentro de los límites de tolerancia,
fue producida en el turno tarde?
RESPUESTAS:
a.1) 19,6% de unidades fuera de tolerancia en turno mañana
a.2) 26,9% de unidades fuera de tolerancia en turno tarde
a.3) 23,4% de unidades fuera de tolerancia en total fábrica
b) 49,6%
5) En una universidad dónde la próxima semana se elegirán representantes estudiantiles entre los candidatos
pre-sentados por tres agrupaciones (A, B, y C), se entrevistó a 12 estudiantes y se obtuvieron los siguientes
datos:
ALUMNO 1: Tiene 19 años de edad, 4 materias aprobadas y piensa votar a los candidatos de la agrupación A.
ALUMNO 2: Tiene 21 años de edad, 15 materias aprobadas y piensa votar a los candidatos de la agrupación B.
ALUMNO 3: Tiene 22 años de edad, 24 materias aprobadas y piensa votar a los candidatos de la agrupación A.
ALUMNO 4: Tiene 19 años de edad, 7 materias aprobadas y piensa votar a los candidatos de la agrupación C.
ALUMNO 5: Tiene 20 años de edad, 10 materias aprobadas y piensa votar a los candidatos de la agrupación A.
ALUMNO 6: Tiene 21 años de edad, 10 materias aprobadas y piensa votar a los candidatos de la agrupación C.
ALUMNO 7: Tiene 24 años de edad, 22 materias aprobadas y piensa votar a los candidatos de la agrupación A.
ALUMNO 8: Tiene 21 años de edad, 8 materias aprobadas y piensa votar a los candidatos de la agrupación C.
ALUMNO 9: Tiene 23 años de edad, 19 materias aprobadas y aún no tiene decidido su voto.
ALUMNO 10: Tiene 22 años de edad, 15 materias aprobadas y piensa votar a los candidatos de la agrupaciónB.
ALUMNO 11: Tiene 21 años de edad, 17 materias aprobadas y piensa votar a los candidatos de la agrupaciónA.
ALUMNO 12: Tiene 25 años de edad, 28 materias aprobadas y piensa votar a los candidatos de la agrupaciónC.
a) ¿Cuál es el porcentaje de estudiantes entrevistados que:
a.1) piensa votar a los candidatos de la agrupación A?
a.2) tienen como mínimo 20 años de edad?
a.3) han aprobado a lo sumo 15 materias?
b) ¿Qué porcentaje de los estudiantes que piensan votar a los candidatos de la agrupación B, tienen más de 20
años de edad?
c) ¿Qué porcentaje de los que no han decidido votar a la agrupación A:
c.1) tienen menos de 15 materias aprobadas?
c.2) tienen como máximo 21 años de edad?
c.3) piensan votar a los candidatos de la agrupación B?
RESPUESTA: a.1) 41,67% a.2) 83,33% a.3) 58,33% b) 100% c.1) 42,86% c.2) 57,14% c.3) 28,57%