PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL
1.4 ESTADÍSTICA DESCRIPTIVA
Es el estudio de las técnicas para recopilar, organizar y presentar datos obtenidos en un estudio
estadístico para facilitar su análisis y aplicación.
1.4.1 RECOPILACIÓN DE DATOS
Fuentes de datos
1) Investigación en registros administrativos: INEC, Banco Central, Cámaras de la
Producción, Universidades, etc. para obtener índices de empleo, índice de precios, datos
de salud, datos de eficiencia, etc.
2) Obtención de datos mediante encuestas de investigación Ej. Estudios de mercado.
Estudios de preferencia electoral, etc
3) Realización de experimentos estadísticos
Criterios para diseñar una encuesta de investigación
1) Definir el objetivo del estudio
2) Definir la población de interés
3) Determinar el tamaño de la muestra
4) Seleccionar el tipo de muestreo
5) Elegir temas generales
6) Elaborar el formulario para la encuesta: Preguntas cortas, claras y de opciones.
7) Realizar pruebas
8) Realizar la encuesta
Tipos de datos
Los resultados que se obtiene pueden ser
1) Datos cualitativos: corresponden a respuestas categóricas
Ej. El estado civil de una persona
2) Datos cuantitativos: corresponden a respuestas numéricas
Ej. La edad en años.
Los datos cuantitativos pueden ser
1) Discretos: Se obtienen mediante conteos
2) Continuos: Se obtienen mediante mediciones
1.4.2 SIMBOLOGÍA
Sea N el tamaño de la población objetivo y n el número de elementos que se incluyen en la
muestra, entonces si X representa la característica que es de interés estudiar, la muestra es el
conjunto de variables:
X: {X1, X2, ..., Xn}
En la notación vectorial, X es un vector de n variables:
XT = (X1, X2, ..., Xn)
Cada variable puede tomar un valor que se obtiene mediante una medición, y estos valores se los
puede representar por
x: {x1, x2, ..., xn}
Si se escribe X1 = x1 debe entenderse que al tomar la medición, para la variable X1 se obtuvo el
valor x1. Entonces el vector de datos se puede escribir
xT = (x1, x2, ..., xn)
Ing. Luis Rodríguez Ojeda, MSc
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL
Ejemplo. Una bodega contiene N = 50 artículos. Cada uno puede estar en tres estados: aceptable
(a), regular (r), o defectuoso (d). Para una inspección se decide tomar una muestra X de
n = 4 artículos elegidos al azar. Entonces,
X: {X1, X2, X3, X4}, representa cada muestra que se puede obtener
Supongamos que los valores obtenidos son respectivamente: d, a, a, r. Entonces
X1 = d, X2 = a, X3 = a, X1 = r
x: {d, a, a, r} son los datos que se obtuvieron en esta muestra
Es útil ordenar los datos de la muestra. Para representar una muestra de tal manera que los
valores de las n variables estén en forma ordenada creciente se usa la siguiente notación:
X(1), X(2), ..., X(n)
Esto implica que X(1) ≤ X(2) ≤ ... ≤ X(n-1) ≤ X(n)
Las variables X(1), X(2), ..., X(n) se denominan estadísticos de orden 1, 2, ..., n respectivamente.
Ejemplo. Una muestra de tamaño n = 4 contiene los valores
X1 = 7, X2 = 8, X3 = 5, X4 = 2
Entonces
X(1) = 2, X(2) = 5, X(3) = 7, X(4) = 8
1.4.3 DESCRIPCIÓN DE CONJUNTOS DE DATOS
Los datos obtenidos se los puede representar de diferentes formas:
1) Tabularmente
2) Gráficamente
3) Mediante números que caracterizan al grupo de datos
Si la muestra contiene pocos datos, estos se pueden representar directamente. Pero si el número
de datos es grande conviene agruparlos para facilitar su análisis
Ing. Luis Rodríguez Ojeda, MSc
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL
1.4.4 TABLA DE FRECUENCIAS
Es un dispositivo para agrupación de datos y facilitar su interpretación.
Recomendaciones para construir la Tabla de Frecuencias
Sea X una muestra de tamaño n
1) Identificar la unidad de medida de los datos
2) Obtener el rango de los datos: distancia entre el mayor y el menor valor de los datos
R = X(n) - X(1) (Rango de los datos)
3) Seleccionar el numero de clases (o intervalos) k, para agrupar los datos.
Sugerencia para elegir k
Sean n: número de datos
k: Número de clases
n k
Menos de 50 5a7
Entre 50 y 100 6 a 10
Entre 100 y 250 7 a 12
Mas de 250 10 a 20
4) Obtener la longitud de las clases,
L = R/k (Longitud)
Se puede redefinir la longitud, el número de clases y los extremos de cada clase de tal
manera que las clases tengan la misma longitud y los intervalos de cada clase incluyan a
todos los datos, sean excluyentes y los valores en los extremos de cada clase sean simples.
Si ai, bi son los extremos de la clase i, entonces el intervalo de la clase i es [ai, bi)
5) Realizar el conteo de datos para obtener la frecuencia en cada clase
Notación n: número de datos
k: número de clases
fi: frecuencia de la clase i, i=1, 2, 3, …, k
fi/n: frecuencia relativa de la clase i
Fi: frecuencia acumulada de la clase i: Fi = f1+f2+f3+…+fi
Fi/n: frecuencia acumulada relativa de la clase i
mi : marca de la clase i (es el valor central del intervalo de la clase i)
Los resultados se los organiza en un cuadro denominado Tabla de Frecuencia
Ejemplo.- Obtenga la Tabla de Frecuencias para los siguientes 40 datos de una muestra,
correspondientes al tiempo que se utilizó para atender a las personas en una estación de servicio:
3.1 4.9 2.8 3.6
4.5 3.5 2.8 4.1
2.9 2.1 3.7 4.1
2.7 4.2 3.5 3.7
3.8 2.2 4.4 2.9
5.1 1.8 2.5 6.2
2.5 3.6 5.6 4.8
3.6 6.1 5.1 3.9
4.3 5.7 4.7 4.6
5.1 4.9 4.2 3.1
Ing. Luis Rodríguez Ojeda, MSc
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS ICM ESPOL
Solución
1) Precisión: un decimal
2) Rango: R = 6.2 – 1.8 = 4.4
3) Número de clases: k=6
4) Longitud: R/k = 0.7333...
Por simplicidad se redefine la longitud como 1 y se usan números enteros para los
extremos de las clases.
5) Conteo de los datos (puede hacerse en un solo recorrido), n=40
Número Clase (Intervalo) Frecuencia absoluta
1 [1, 2) 1
2 [2, 3) 9
3 [3, 4) 11
4 [4, 5) 12
5 [5, 6) 5
6 [6, 7) 2
Tabla de Frecuencias
Frecuencia Frecuencia
Número Clase Marca de Frecuencia Frecuencia
absoluta relativa
(Intervalo) clase absoluta relativa
acumulada acumulada
i [a, b) m f f/n
F F/n
1 [1, 2) 1.5 1 0.025 1 0.025
2 [2, 3) 2.5 9 0.225 10 0.250
3 [3, 4) 3.5 11 0.275 21 0.525
4 [4, 5) 4.5 12 0.300 33 0.825
5 [5, 6) 5.5 5 0.125 38 0.950
6 [6, 7) 6.5 2 0.050 40 1.000
Ing. Luis Rodríguez Ojeda, MSc