Material de Apoyo
Programa: estadística y Probabilidad
Definición de estadística.
Debido a lo extenso y variado del campo cubierto por la estadística, es difícil establecer una
definición precisa del concepto. Ha sido definida de diversas formas; una de ellas consiste en
concebirla como una metodología científica que trata de la recolección, organización y presentación
de los datos para analizarlos e interpretarlos y hacer predicciones e inferencias.
La estadística está clasificada en dos tipos, que son la estadística descriptiva y la estadística
inferencial, las cuales desempeñan funciones diferentes pero complementarias en el análisis
estadístico.
Estadística Descriptiva: trata del resumen y descripción de los datos ya sea en forma tabular,
gráfico o numérico. El análisis se limita en si mismo a los datos recolectados sin hacer
generalizaciones sobre la totalidad de donde provienen esas observaciones.
Por ejemplo, si un jefe de personal realiza un test de aptitud a un grupo de graduados de un
instituto superior, recientemente contratados; entre los resultados de las puntuaciones del test que
podemos hacer, valiéndonos de la estadística descriptiva están los siguientes aspectos: arreglar o
clasificar las puntuaciones, construir tablas, cuadros y gráficas, calcular el promedio de las
puntuaciones, describir la variabilidad de los datos, observar algo sobre la aptitud típica de los
empleados, y otros aspectos, pero sin hacer generalizaciones sobre poblaciones mayores de
estudiantes graduados.
Estadística Inferencial: consiste en extraer conclusiones útiles sobre la totalidad de los datos u
observaciones, con base a la información recolectada en una muestra.
Por ejemplo, supongamos que se recibe un embarque de mercancías de 5000 unidades y la
empresa quiere saber si dicha mercancía cumple con los estándares de calidad. Se inspeccionan 50
unidades tomadas al azar y se encuentra que sólo 2 son defectuosas. Este resultado de la muestra
permite tener una idea general sobre la calidad del total de la mercancía. (Piense en otra
situación, cualquiera que fuere, donde se evidencie la estadística inferencial).
Definiciones de Población, Muestra, Parámetro, Estadígrafo
Población: es la colección completa de todos los elementos que son objeto de estudio (personas,
puntuaciones, mediciones, etc).
Muestra: es un subconjunto de miembros seleccionados de una población
Parámetro: es una medición numérica que describe algunas características de una población.
Estadígrafo o estadístico: es una medición numérica que describe algunas características de una
muestra. Cualquiera medición numérica, por ejemplo, una media (promedio) o un porcentaje, si
están referidos a una población, los llamamos parámetros; pero si los mismos se refieren a una
muestra, entonces, los identificamos como estadígrafos o estadísticos.
Recolección de los datos: los datos estadísticos a ser analizados deben ser tomados de fuentes
altamente confiables y además deben utilizarse buenos instrumentos para su recolección. Entre los
diversos métodos para hacer la recolección de los datos, se mencionan los siguientes:
Observaciones directas
Entrevistas
Cuestionarios
Definiciones de datos y variables.
Datos: son números o medidas que han sido recolectados como resultado de las observaciones.
Datos cuantitativos: consisten en números que representan conteos o mediciones. Ejemplos;
peso en kilogramos, estatura, ingreso en bolívares, etc.
Datos cualitativos: son aquellos que no poseen características numéricas, que se refieren a
atributos tales como, color de los ojos, sexo, estado civil, preferencia por una marca, etc.
Datos discretos (cuantitativos): son aquellos que resultan cuando el número de posibles valores
es un número finito o entero, es decir, un número que puede contarse con facilidad. Ejemplos;
número de errores, cantidad de alumnos inscritos, artículos defectuosos, etc. (el número puede
ser 2, 20, 30 o cualquier número entero).
Datos continuos (cuantitativos): son aquellos que pueden asumir cualquier valor dentro de un
intervalo continuo, generalmente de tiempo o espacio. Ejemplos; edad (puede ser 30 años, 30.7
años), peso en kg (70 kg, 70.5 kg, 85.75 kg), precio (2 dólares, 12.85 dólares)
Variable: es toda característica que puede asumir diferentes valores en personas, lugares o cosas.
Ejemplos; la estatura de los trabajadores, sexo de los estudiantes, ingreso familiar, etc.
Variable cuantitativa: es aquella que asume valores acompañados con una unidad de medida.
Ejemplos; horas de trabajo, gastos de alimentación, etc.
Variable cualitativa: es la que se refiere a atributos o clasificaciones como color de cabello,
estado civil o preferencia por una carrera de estudio.
Tabla de frecuencias (distribución de frecuencias): es un arreglo tabular de las frecuencias con
que ocurre cada característica en que se han dividido los datos.
La construcción de una tabla de frecuencias para datos cuantitativos presenta como su punto
de mayor importancia, la determinación del número de intervalos (clases) que la conforman, que
va a depender de la cantidad de datos. Las reglas para la determinación del número de intervalos
se darán en el siguiente tema, por ahora nos ocuparemos de definir y explicar los elementos que la
conforman.
A continuación se presenta una tabla de frecuencias (TABLA 1) con datos arbitrarios y ficticios de
los pesos en kilogramos de 50 trabajadoras una industria de confección de prendas de vestir.
TABLA 1
Peso en kgs de 50 trabajadoras de la confección de ropa
Clase Intervalo fa mi FA fr (fa /n) FR(FA/n)
1 53-55 2 54 2 2/50=0.04 2/50=0.04
2 56-58 5 57 7 5/50=0.1 7/50=0.14
3 59-61 9 60 16 9/50=0.18 16/50=0.32
4 62-64 15 63 31 15/50=0.3 31/50=0.62
5 65-67 12 66 43 12/50=0.24 43/50=0.86
6 68-70 5 69 48 5/50=0.1 48/50=0.96
7 71-73 2 72 50 2/50=0.04 50/50=1
Intervalo de clase: es el campo de variación seleccionado para agrupar un conjunto de datos.
Todos deben tener la misma longitud o amplitud. Por ejemplo, el intervalo de la clase 1 consta de
tres valores (53, 54, 55); el intervalo de la clase 2 igualmente tres valores (56, 57, 58), y así
sucesivamente.
Frecuencia absoluta (fa): es el número de veces que se repite un dato en particular. La frecuencia
absoluta de la clase 3 es de 9 (trabajadoras) y de la clase 5 es de 12.
Marca de clase (mi): es el punto medio del intervalo de clase. Cada marca de clase se determina
sumando el límite de la clase inferior con el límite de la clase superior y dividiendo la suma entre
dos. Por ejemplo, en la clase 1 del intervalo se tiene la marca de clase, m1= 53 + 55 = 54, de manera
2
similar, se obtiene m3= 60
Frecuencia acumulada absoluta (FA): es la suma de las frecuencias para esa clase y todas las
frecuencias de las anteriores. Por ejemplo, para obtener la frecuencia acumulada de la clase 3 (F3)
se le suma a la frecuencia absoluta de la clase (f3= 9), la frecuencia acumulada de la clase 2 (F2= 7),
es decir, 9 + 7 = 16, entonces, F3= 16
Frecuencia relativa (fr): es el cociente entre la frecuencia absoluta de la clase y el número de
datos (total de frecuencias). fr = fa /n. Según la Tabla 1, la frecuencia relativa de la clase 1 es:
fr1=2/50 = 0.04 (expresado en porcentaje es: 0.04 X 100= 4%).
Frecuencia relativa acumulada (FR): es el cociente entre la frecuencia acumulada absoluta y el
total de frecuencias. FR= FA /n. También se puede obtener al sumar a la frecuencia relativa de esa
clase todas las demás frecuencias relativas anteriores. Si se construye de manera correcta, la suma
de las frecuencias relativas debe totalizar 1 (o 100), con algunas pequeñas discrepancias que se
permiten al aproximar con decimales.
Al visualizar la Tabla 1 podemos apreciar entre algunos aspectos, los siguientes:
1. La mayor frecuencia (15) está ubicada en la clase 4, o también se puede decir, en el
intervalo 62-64
2. 9 trabajadoras tienen un peso promedio de 60 kgs.
3. 43 trabajadoras tienen pesos menores o iguales a 67 kgs.
4. El 24% de las trabajadoras tienen un peso promedio de 66 kgs.
5. El 86% de las trabajadoras tienen un peso menor o igual a 67 kgs. El 14% tienen un peso
superior a 67 kgs.
6. La clase en la cual se ubica por lo menos el 90% de las observaciones es la clase 6. Se debe
elegir la clase inmediata superior al porcentaje dado; en la clase 5 es 86% (acumulado hasta
86%), el 90% se encuentra en la siguiente clase.
La información presentada anteriormente en forma tabular (Tabla 1) se puede representar
gráficamente, empleando por ejemplo, un histograma de frecuencias absolutas.
El histograma de frecuencias es una sucesión de rectángulos construidos sobre un sistema de
coordenadas cartesianas en la forma siguiente:
1. Las bases de los rectángulos se ubican en el eje horizontal; La longitud de la base es igual al
ancho del intervalo.
2. La altura de los rectángulos se registran sobre el eje vertical y corresponden a las
frecuencias de clases.
3. Las áreas de los rectángulos son proporcionales a las frecuencias de clases.
Los histogramas también pueden estar referidos a las frecuencias acumuladas y a las frecuencias
relativas.
Histograma de frecuencias absolutas de los datos de la Tabla 1
16
12
52.5 55.5 58.5 61.5 64.5 67.5 70.5 73.5
Se puede observar que los límites inferiores y límites superiores de los intervalos en la base del
rectángulo están continuos (sin saltos); esto se debe a que estamos considerando una variable
continua (Peso en kilogramos). Una trabajadora pudiera pesar exactamente 55.5 kgs y se tendría la
dificultad para ubicarla en el intervalo, porque podría estar en la tabla con 55 kgs o 56 kgs,(ver Tabla
1) lo cual no es correcto. Con el propósito de reflejar la idea de continuidad (Peso en kgs), los
intervalos deben estar unidos, y esto se logra buscando la diferencia entre el límite superior de una
clase y el límite superior de la clase siguiente (ver Tabla 1); por ejemplo: 59 (clase 3) y 58 (clase 2),
59-58 = 1 Luego se suma la mitad de ese resultado (1/2 = 0.5) a cada límite de la clase superior, y
se le resta también la mitad de esa cantidad a cada límite de la clase inferior. En la primera clase es
52.5 (lím. Inf.) y 55.5 (lím. Sup.); en la segunda clase es 55.5 (lím. Inf.) y 58.5 (lím. Sup.) y así
sucesivamente. De este modo se pueden visualizar los intervalos de clases de manera continua
tanto en la tabla como en el histograma.
Es oportuno recalcar, que si alguna trabajadora llegase a pesar 55.5 kgs; quedará al criterio del
investigador de seleccionarla para la primera clase o para la segunda clase. No se debe elegir dos
veces, y el criterio de selección regirá para todas las demás clases.
Aparte de los histogramas de frecuencias absolutas, hay muchos gráficos más; se le sugiere
consultar otras fuentes bibliográficas sobre la estadística, incluidos los textos de Educación Media
General, en donde podrá encontrar histogramas de frecuencias acumuladas y relativas, polígonos
de frecuencias, ojivas, gráficos de barras, diagramas circulares, entre otros.