Guía de Estadística Descriptiva
Guía de Estadística Descriptiva
Diciembre 2020
ÍNDICE
Resumen _________________________________________ ii
Capítulo 1. Introducción a la Estadística __________________ 1
I
Resumen
En cada capítulo se desarrollan ejemplos con datos estadísticos relativos al grado aca-
démico de actividad física, y al final de cada capítulo se proponen ejercicios de refuerzo.
II
Capítulo 1. Introducción a la Estadística
1
mente grande. El tamaño de la muestra es denotado por n. De los ejemplos anteriores de pobla-
ción las muestras serían de inferior tamaño y que se son seleccionadas con técnicas de muestreo
que podrían ser probabilísticas y no probabilísticas. Cabe aclarar que los resultados obtenidos con
las técnicas no probabilísticas están restringidos a la misma muestra, es decir no se pueden ex-
tender a la población, al no poder determinar adecuadamente de un error de muestreo.
Las variables cualitativas no son susceptibles de medición, solo toman atributos o cualidades.
Ejemplo: género (Femenino, Masculino), nivel de estudios alcanzados (Bachillerato, Pregrado,
Posgrado), color de ojos (negro, azul, verde, …). El tratamiento de las variables, está limitado a su
tipo y además a los niveles de medida que estas poseen. Estos niveles se exponen a continuación:
El Nivel de razón (Escala) se identifica por tener el cero es absoluto, es decir corres-
ponde a la ausencia de medida, por lo que existe una relación de orden. Por ejemplo, el número
de hijos por familia es una variable que tiene un cero absoluto.
El Nivel de intervalo, se presenta cuando, el cero es relativo. El cero no significa ausen-
cia de medida. Por ejemplo: Temperatura (oF) no significa ausencia de temperatura; consumo
mensual de energía eléctrica (Kw).
Nivel Ordinal, corresponde a valores de orden. Por ejemplo, a) podemos estudiar la va-
riable “nivel de satisfacción de un producto”, como muy satisfactorio, satisfactorio, poco satis-
factorio. b) rango profesional, calificación.
Nivel Nominal, corresponde a variables cuyos atributos son simples etiquetas. La rela-
ción es de igualdad entre los atributos de la variable. Por ejemplo, a) la variable raza, toma
valores tales como: blanca, negra y otro tipo de razas. b) sexo, c) síndromes psicológicos (neu-
rosis, depresión, entre otros).
2
Tipos de variables
Cuantitativas Cualitativas
Subtipo:
Discretas Continuas
Observación: Los diferentes valores que toma la variable pueden codificarse utilizando una es-
cala alfabética o numérica. Por ejemplo, la variable género toma dos valores, que pueden ser co-
dificados como: Masculino = 1, Femenino = 2; o masculino = m, femenino = f.
Los parámetros y los estadísticos son medidas estadísticas que describen a la variable
a través de una sola medida, si se obtienen de la población se dicen parámetros (, 2, , p), y si se
obtienen de la muestra se llaman estadísticos (x, s2, s, p̂ ).
1.3.1. La Encuesta
Existen varios instrumentos para recoger la información, pero en esta ocasión solo hablare-
mos de la encuesta. “La encuesta es una técnica que se lleva a cabo mediante la aplicación de un
cuestionario a una muestra de personas. Las encuestas proporcionan información sobre las opi-
niones, actitudes y comportamientos de los ciudadanos”
3
- Objetivo general de la investigación
- Instrucciones sobre la forma de responder a las pregunta, tiempo y recomendaciones
- Datos informativos, que corresponden a la identificación del estrato a encuestar
- Cuerpo de la encuesta, que puede estar organizada en secciones, pudiendo corresponder
a objetivos específicos o áreas a consultar.
Se recomienda redactar este documento con lenguaje claro y acorde al grupo a quien va diri-
gida la encuesta. No excederse en las preguntas para no cansar y así evitar respuestas apresu-
radas sin tomarse el tiempo necesario para dar una respuesta real. hacer preguntas claras, a
fin de evitar confusión en la pregunta y por ende en la respuesta, no preguntas ambiguas, no
preguntas compuestas por dos ideas. No cambiar la forma de preguntar en positivo a negativo
o de escala ascendente.
4
Ejemplo 1.1.
Similar a la descripción dada en la tabla 1., añada más variable y complete la información.
En la pregunta 11, se ha usado la escala de Likert, la misma que está formada por 3 o más
valores (puntaje) por lo general impares hasta el 9, que ayudan a expresar de forma ordinal las
opiniones, en este rango, se incluye un valor central o neutral. Una vez diseñada la matriz de da-
tos, y luego de aplicar la encuesta, se procede a tabular los datos en el programa estadístico que
se haya elegido, tomando en cuenta para ello el tipo de variables y sus niveles de medida. Recordar
que, si se elige una codificación numérica para los atributos de una variable cualitativa, esto solo
se lo hacer por facilidad en el ingreso de los datos, pero nunca tendrá el tratamiento de una varia-
ble cuantitativa.
5
1.5. Tabla de distribución de frecuencias
Una vez creada la matriz de datos, se pude iniciar con el análisis estadístico, empezando desde
lo básico que sería una tabla de frecuencias.
Ejemplo 1.2
Tabla 3. Distribución de asignaturas por preferencia
Asignatura preferida ni fi Ni Fi
Matemáticas 12 0.24 12 0.24
Física 18 0.36 30 0.60
Química 20 0.40 50 1.00
TOTAL: 50 1.00
Los pasos que se deben seguir para construir una distribución de frecuencias son:
6
1. Elegir el número de clases k = 1+3.322 * log(n) Fórmula de Sturguess
2. Hallar la longitud de los intervalos L = Rango/k = (xmáx – xmín)/ k
L se elegirá de manera conveniente de modo, que se conserve el número de clases, por lo
que no siempre se seguirán reglas de redondeo; siempre y cuando no se tome un valor
demasiado alto, se debe considerar el rango de variación de los datos.
3. Fije el límite inferior de la primera clase li tal que li ≤ xmín.
Determine el límite superior de la última clase, ls tal que ls ≥ xmax, donde ls = li +k*L
En el caso de obtener un exceso, es decir si ls > xmax, este se repartirá de forma equitativa
en los extremos inferior y superior de la primera y última clase.
4. Construya la tabla, definiendo intervalos semiabiertos, es decir (li, ls]
Ejemplo 1.3
Con los pesos en libras de un grupo de personas que se están sometiendo a unas pruebas físi-
cas, construya una tabla de distribución de frecuencias y discuta los resultados hallados.
133 133 135 136 137 138 140 140 141 142 143 143
143 144 144 144 146 146 147 148 148 148 148 149
149 149 149 150 151 151 151 152 153 153 153 153
154 154 155 155 155 155 156 156 156 156 157 158
158 158 159 159 160 160 161 162 163 164 166 166
167 168 170 172 175 176 178 178 180 180 181 181
185 186 187 189 190 191 192 192 192 199 200 201
204 205 206 208 210 211
Solución
1. Número de clases: k = 1 + 3.322*log(90) = 7.49 k=7
2. Rango = 211 – 133 = 78 Longitud de clases L = R/k = 78/7 = 11.14
3. Límite inferior de la primera clase y superior de la última clase:
Límite inferior de la primera clase li = 133 ls = 133+7*11.14 = 210.98, no con-
tiene al último dato, por lo que se toma un valor más grande de L, así L =12.
Tome en cuenta la precisión o el rango de los datos para no exagerar en la longitud de L.
Luego: ls = 133+7*12 = 217 exceso = e = 6, que se repartirá 3 en cada extremo.
Por lo que: li = 133-3 = 130 y ls = 211+3 = 214
4. Construcción de la tabla con intervalos de tipo ] li, ls], es decir, abiertos a la izquierda y
cerrados a la derecha. El límite inferior será cerrado solamente cuando, el límite inferior
de la primera clase, coincida con el valor mínimo de la variable. A continuación, se pre-
senta la tabla como resultado del proceso aplicado.
7
Tabla 4. Tabla de frecuencias de pesos de personas, sometidas a pruebas físicas, con exceso = 6
Se añadió la columna de la marca de clase es el punto medio del intervalo (xi = (li+ls)/2), que
será utilidad para hallar más adelante medidas descriptivas para datos agrupados.
Existe una mayor concentración de observaciones en las primeras tres categorías, y repre-
sentan el 64.44% del grupo estudiado con pesos inferiores a 166 libras.
En las tres últimas categorías se encuentran las personas con pesos mayores o iguales a 178
libras y representan el 26.7%
Ejemplo 1.4
Considerando el ejemplo anterior, se quiere un exceso más pequeño, por lo que se toma
de forma conveniente L =11.2, y se conserva el número de clases.
Paso 3: e = L*k – R = 11.2*7 – 78 = 78.4 – 78 = 0.4 , este exceso será repartido equitativa-
mente en los extremos inferior y superior de la tabla: li =133-0.2 = 132.8, ls =211+0.2 =211.2
Paso 4: Construir la tabla:
Clases Li ls Marca Clase ni Ni fi Fi
1 132,8 144,0 138,4 16 16 0,1778 0,1778
2 144,0 155,2 149,6 26 42 0,2889 0,4667
3 155,2 166,4 160,8 18 60 0,2000 0,6667
4 166,4 177,6 172,0 6 66 0,0667 0,7333
5 177,6 188,8 183,2 9 75 0,1000 0,8333
6 188,8 200,0 194,4 7 82 0,0778 0,9111
7 200,0 211,2 205,6 8 90 0,0889 1,0000
90 1,0000
8
El método del exceso es más largo, pero resulta más exacto. Sin embargo, al momento de uti-
lizar programas estadísticos el número de clases no siempre coincidirá, pues estos programas po-
drían usar otros métodos o algoritmos.
Otros métodos: El número de clases k, se toma de modo que sea el número entero más pe-
queño que cumple con 2k n.
Excel permite también utilizar las clases construidas por el usuario, eligiendo rango de clases,
que simplemente es el conjunto de límites superiores construidos con las fórmulas.
Salida de SPSS (Statistical Packaged ofd social sciences). El número se obtiene por defecto
solamente, pero los datos se distribuyen de forma individual y no en clases como en los casos
anteriores. A continuación, se presenta parte de la tabla de frecuencias.
9
1.6. Gráficos estadísticos
El gráfico a escoger dependerá del tipo de variable, según el esquema siguiente:
Barras
Variables cualitativas Pastel
Pictogramas
Histogramas
Variables cuantitativas Líneas
Caja
Tallo y Hojas
Dispersión
Variables cuantitativas
Histograma de frecuencias. - Las barras deben ir juntas porque corresponden a datos con-
tinuos. Las frecuencias pueden ser absolutas o acumuladas.
Polígono de frecuencias. - Se obtiene por la unión de las marcas de clase en los techos de
cada barra ya sea del histograma de frecuencias relativas o relativas acumuladas.
Línea. - Representa pares ordenadas, se usa para datos cuantitativos como series de
tiempo, ayudando a estudiar la tendencia.
Gráfico de dispersión. - Representa parejas de datos cuantitativos (x, y) para estudiar la
relación entre dos variables.
Gráfico de caja. - Es una caja que contiene en forma ordenada las medidas descriptivas
como la media, mediana, cuartil uno y cuartil tres. Ayuda a estudiar el tipo de sesgo de la
distribución.
Diagrama de tallo y hojas. - Es la representación de los datos con sus respetivas frecuen-
cias. En el tallo se pueden ubicar los datos correspondientes a ciertas unidades de decena,
centena o enteros, etc., mientras que en las hojas se distribuyen las unidades inferiores
(resto de dígitos).
10
Gráfico de barras de la asignatura preferida Gráfico de pastel del deporte practicado.
Histograma de frec. absolutas de pesos Diagrama de caja de los pesos de las personas
que están sometidas a pruebas físicas.
220
200
180
160
140
pesos
Diagrama de tallo y hojas de Pesos de las personas que se han sometido a pruebas físicas)
TALLO HOJAS Pesos de las personas que se han sometido a pruebas físicas)
13 335678
14 001233344466788889999
15 011123334455556666788899
16 0012346678
17 02568800115679
18 00115679
19 012229
20 014568
21 01
(En tallo se han colocado las decenas y en las hojas las unidades)
11
1.7. Tablas de contingencia
Es una tabla cruzada, entre dos variables, las mismas que pueden ser cualitativas, discretas
o una combinación de las dos. Se utilizan para determinar de forma descriptiva si existe aso-
ciación entre dichas variables. La tabla está formada por f filas o atributos de la primera varia-
ble y c columnas o atributos de la segunda variable.
Y Y1 Y2 …. Yc Subtotal
X
X1 O11 O12 …. O1c u1
X2 O21 O22 …. O2c u2
: : : : : :
: : : Oij : :
: : : : : :
Xf Of1 Of2 …. Ofc uf
Subotal v1 v2 …. vc n
Donde:
Oij: Frecuencia observada (número de individuos que poseen a la vez los atributos Xi y Yj)
A partir de esta tabla se pueden construir tablas de contingencia con porcentajes por filas, colum-
nas y del total.
Ejemplo 1.5
La siguiente tabla de contingencia muestra la relación entre las variables práctica de actividad
física y el nivel de ingresos, tomado del enlace web: http://cdeporte.rediris.es/revista/re-
vista5/artcalidad.html.
Tabla 13. Tabla de contingencias de las variables práctica deportiva según ingresos mensuales.
12
En la primera fila se observan las frecuencias observadas, las frecuencias esperadas que se
estudiarán más adelante y el porcentaje correspondiente en relación al total de respuestas. A con-
tinuación, se presentan unas variantes que se puede realizar a esta tabla, de las cuales realice la
interpretación:
50000, 100000 26 21 47
100000, 200000 10 4 14
200000, 300000 0 1 1
Subtotal 37 28 65
Como se verá más adelante cada una de estas tablas representan probabilidades.
13
1.8. Medidas descriptivas
Otra herramienta de análisis estadístico son las medidas descriptivas, las mismas que permi-
ten sintetizar un gran número de datos en uno solo; ello proporciona una idea cuantitativa apro-
ximada de toda la distribución. Estas medidas descriptivas se las puede hallar tanto para los datos
distribuidos en tablas de frecuencias o intervalos, así como para datos distribuidos de forma in-
dividual.
Las medidas descriptivas, se pueden clasficar de la siguiente forma:
Media
Tendencia Central Mediana
Moda
Rango
Dispersión Varianza
Desviación estándar
Medidas Descriptivas Coeficiente de variación
Posición Cuartiles
Deciles
Percentiles
Forma Asimetría
Curtosis
Media aritmética
Se define como el promedio de las observaciones.
+ + ... + x n x i ∑𝑚
𝑖=1 𝑥𝑖 ∗𝑛𝑖
x = x1 x 2 = i 1 𝑥̅ = 𝑛
𝑥̅ = ∑𝑚
𝑖=1 𝑥𝑖 𝑓𝑖
n n
Media poblacional N
+ + ... + x N x i ∑𝑚
𝑖=1 𝑥𝑖 ∗𝑛𝑖
μ = x1 x 2 = i 1 𝜇 = 𝑁
𝜇 = ∑𝑚
𝑖=1 𝑥𝑖 𝑓𝑖
N N
14
Donde:
n es el tamaño de la muestra, N es el tamaño de la población
m es el número de datos diferentes
xi es la observación i
ni es la frecuencia absoluta i (número de veces que se repite el dato i)
fi es la frecuencia relativa, definida: fi= ni/n
La última expresión de la media, también se llama media ponderada, cuando el lugar de usar
la frecuencia relativa como la razón ni/n, se asigna de forma conveniente dicho valor.
Ejemplo 1.6
La media para la muestra: 2, 4, 4, 5, 6, 7, 7 es
2 4 * 2 5 6 7 * 2 35 =5
x= =
7 7
Ejemplo 1.7
El curso de Estadísta considera 7 instrumentos de evaluación en cada unidad, con las ponde-
raciones que se indica a continuación. ¿Cuál sería la media ponderada?
Instrumento de eva- Ponderación
luación
Actuación en clase (AC) 10%
Lección diaria (LD) 10%
Taller (T) 10%
Deber (D) 10%
Prueba 1 (P1) 20%
Prueba 2 (P2) 20%
Prueba 3 (P3) 20%
Total ponderaciones: 100%
15
Mediana
Se denomina mediana al valor central de los datos cuando estos se han dispuesto ordenada-
mente.
Caso Mediana para datos no agrupados
Muestra Caso 1. Me = X(n+1)/2 con número de datos impar
Ejemplo 1.8.
Halle la mediana para datos no agrupados con los siguientes datos:
Caso 1: 12, 14, 14, 15, 16, 17, 17. Me = X(7+1)/2 = X4 = 15.
Caso 2: 12, 14, 14, 15, 16, 17, 17, 17. Me = X (8/2) X (8/2)1 = (15+16)/2 = 15.5
2
Moda
Es el valor o valores que tienen mayor frecuencia (aparecen el mayor número de veces). Puede
haber una, dos, tres o más modas, por lo que las distribuciones se llamarán respectivamente uni-
modal, bimodal, trimodal y multimodal. Si todos los datos se repiten una sola vez, o el mismo
número de veces, no hay moda.
Observaciones de la moda:
Es interesante cuando su frecuencia se destaca respecto al resto de frecuencias.
Importante en las variables cualitativas, por ser el único parámetro que se calcula.
No siempre se sitúa en la zona central, pese a ser una medida de centralización.
Nota. - Las medidas descriptivas anteriores, se usan tanto para la población como para la
muestra, haciendo un simple cambio de n por N.
16
Ejemplo 1.9.
Con los datos de una muestra sobre la Resistencias en Ohmios de 100 bobinas, halle: (a) media,
(b) mediana y (c) moda, para el caso de datos no agrupados.
No. Resistencia en Ohmios Xi ni Xi.ni
1 32.7 1 p
2 32.8 1 n i xi
3 32.9 3 (a) x= i 1
=
n
4 33.0 5
5 33.1 9 (b) Me =
6 33.2 9
7 33.3 10 (c) Mo =
8 33.4 Mediana 12
9 33.5 Moda 14
10 33.6 13
11 33.7 8
12 33.8 6
13 33.9 4
14 34.0 2
15 34.1 2
16 34.2 0
17 34.3 0
18 34.4 1
TOTAL: 100 3339.6
17
1.8.1.2. Medidas de dispersión
Estas medidas reflejan la dispersión existente entre los datos y las medidas de tendencia cen-
tral. Para una variable estadística que toma los valores x1, x2, x3, ... , xn, con frecuencias absolutas
n1, n2, ..., nn respectivamente, se definen las siguientes medidas de dispersión:
Rango = Xmáx-Xmín
Desviación media
Es el promedio de las desviaciones de las observaciones respecto a la media.
Dm= x i x .n i
n
Varianza
Puesto que la desviación media no toma en cuenta la distribución de los datos, se introduce
esta nueva medida llamada varianza, que es el promedio de los cuadrados de las desviaciones de
los datos respecto a la media.
Varianza muestral Varianza poblacional
∑𝑚 2
𝑖=1(𝑥𝑖−𝑥̅ ) 𝑛𝑖 ∑𝑚 2
𝑖=1(𝑥𝑖−𝜇) 𝑛𝑖
𝑆2 = udd2 𝜎2 = 𝑁
udd2
𝑛−1
Desviación estándar
La desviación estándar o desviación típica se define como la raíz cuadrada de la varianza. Su
uso es adecuado para efectos de interpretación, ya está dada en las mismas unidades de la
variable de estudio e indica la dispersión tanto a la izquierda como a la derecha de la media.
Ejemplo 1.10
Halle la desviación estándar, para los siguientes datos: 2, 4, 4, 5, 6, 7, 7.
Solución: La media es x = 5.
La desviación estándar será: (2 5) 2 (4 5) 2 2 (5 5) 2 (6 5) 2 (7 5) 2 2 20
s 1.83
6 6
Coeficiente de variación
Este coeficiente también mide la dispersión en relación a la media, se mide en términos de
s
porcentaje. Útil para comparar dos muestras respecto a una misma variable. C.V = *100%.
x
18
Ejemplo 1.11
Así como la mediana divide a los datos de una distribución en dos partes iguales. También
existen otras medidas que dividen a la distribución hasta en cien partes.
Cuartiles (4 partes)
-----Q1-----Q2-----Q3-----
Se tienen tres cuartiles Q1, Q2 y Q3 y dividen al conjunto de datos en cuatro partes iguales.
Interpretación:
Q1, El 25% de los datos son inferiores a Q1, o, también, el 75% de los datos son superiores a Q1
Q3, supera al 75% de los datos, o Q3 es superado por el 25% de los datos.
Se observa que la mediana es el cuartil 2. Se puede hallar el rango intercuartil que está definido
como el intervalo que contiene al 50% de datos centrales, luego RI = Q3 – Q1. Medida es que no
está influenciada por los datos extremos.
Percentiles
Se tienen 99 percentiles y dividen al conjunto de datos en cien partes iguales.
En términos de proporción: 𝑋(𝑛+1)𝑝 siendo 0≤p≤1
En términos de porcentjae: 𝑋(𝑛+1)𝑝% siendo 0≤p%≤100
100%
Por ejemplo:
P50% = Me = X(n+1)(1/2) = X(n+1)(0.5) =
19
Ejemplo 1.12.
Percentil 80% de un conjunto de 35 datos: X36*0.8= X28.8= X29.
Ejemplo 1.14
Con los datos de una muestra sobre la Resistencias en Ohmios de 100 bobinas, halle: a) Los
cuartiles b) los percentiles 5, 10, 90 y 95
20
Coeficiente de curtosis o apuntamiento (α4)
También se lo conoce como “momento centrado de orden cuatro”, y mide el grado de concen-
tración de los valores en función del alargamiento (apuntamiento). Se lo denota con 4 y tiene un
punto crítico considerado normal en α4=3. Se lo calcula a través de:
∑𝑚 4
𝑖=1(𝑥𝑖 − 𝑥̅ ) ∗ 𝑛𝑖
𝛼4 = 𝑛
𝑠4
𝑛(𝑛+1) 𝑥𝑖 −𝑥̅ 4 (𝑛−1)2
O también: 𝛼4 = (𝑛−1)(𝑛−2)(𝑛−3) ∑𝑚
𝑖=1( ) ∗ 𝑛𝑖 − 3 (𝑛−2)(𝑛−3)
𝑠
Ejemplo 1.15
Para una muestra de Resistencias en Ohmios de 100 bobinas, se han encontrado un resumen
de medidas descriptivas en STATGRAPHICS y el histograma de frecuencias con SPSS.
Estadísticas: resistencias
Sample size 100
Average 33.441
Median 33.45
Mode 33.5
Variance 0.09638
Standard dev. 0.31045
Minimum 32.7
Maximum 34.4
Range 1.7
Lower quartile 33.2
Upper quartile 33.6
Skewness 0.19857 o también
21
20
10
Std. D ev = , 31
Mean = 33,44
0 N = 100, 00
32, 75 33, 00 33, 25 33, 50 33, 75 34, 00 34, 25
32, 88 33, 13 33, 38 33, 63 33, 88 34, 13 34, 38
RESISTENCIA EN OH MIOS
22
1.9. Ejercicios resueltos
23
1.9.2. Ejemplos de variables meteorológicas
http://www.ideam.gov.co/web/tiempo-y-
clima/indice-ultravioleta-iuv-
Presión atmosférica Cuantitativa Escala - 1029 hPa
por ciudades (hecto- (Quito)
pascales: hPa)
Temperatura (°C) a Cuantitativa Escala - Prom. 7°C
las 06:00
Velocidad del viento Cuantitativa Escala - 4 km/h
(k/h) a las 06:00
Precipitacion (mm) Cuantitativa Escala - 0.7 mm
Nubosidad Cuantitativa Escala - 89%
Llueve Cualitativa Nominal Si Si
No
¿Con qué sistemas
Cualitativa Nominal □ QASIG Otros
georreferénciales □ GRASS
está familiarizado? □ uDIG
□ gvSIG
□ Otros
¿Cómo evaluaría el Cuantita- Ordinal No satisface mis expectativas Satisfacto-
desempeño de tiva-conti- Satisfactorio rio
QASIG? nua Superó mis expectativas
24
22 abril 2020
El tiempo en Quito para hoy es de 7ºC de temperatura mínima y 19ºC de máxima con un 76% de
nubes y una probabilidad de lluvia del 86%.
La sensación térmica en Quito podrá variar entre los diferentes momentos del día con 10ºC a las
07.00 h o los 12ºC de las 19.00 h.
La velocidad del viento será de 4 km/h soplando de dirección noreste.
http://tiempoytemperatura.es/ecuador/quito.html#por-horas
**: https://metode.es/revistas-metode/monograficos/el-tamano-del-genoma-y-la-comple-
jidad-de-los-seres-vivos.html
25
1.9.4. Tabla de frecuencias, del tipo de uniforme usado para ir a clase en día lunes (la regla
dice usar color verde). Este caso los valores de la variable y sus frecuencias absolutas
se representan directamente en la tabla para luego hallar las frecuencias relativas.
Uniforme ni fi
Verde 19 19/ 23 = 0.82
Blanco 1 0.04
Gris 1 0.04
Otros 2 0.08
total 23 1.00
Xi 60 72 66 48 40 74 68 50 56 80 62 Total
ni 13 3 4 1 1 8 4 6 3 2 12 57
Se hará una distribución en clases con límites enteros, puesto que esta variable solo toma
este tipo de valores.
Paso 1: n= 57 k= 1+3.322*log(57) = 6,88 = 7
Paso 2: Rango = 80–40 =40 L = Rango/k = 40/7 = 5,7;
pero por conveniencia se toma L=6
Verificar Rango =L*k = 6*7 = 42, exceso = 2
Paso 3: li = 40-1 = 39 ls = 80+1 = 81
Paso 4: Construcción de la table:
Li Ls ni %
39 45 1 1,8%
45 51 7 12,3%
51 57 3 5,3%
57 63 25 43,9%
63 69 8 14,0%
69 75 11 19,3%
75 81 2 3,5%
57 100,0%
26
El 43.9% de los estudiantes tienen una frecuencia cardíaca mayor a 57 y menor o igual a 63.
Mientras que, el 1.8% tienen una frencuencia cardiaca inferior a 45, (posiblemente deportistas
élite, no es una afirmación). Y solo el 3.5% de los estudiantes tendrían una frecuencia cardiac
superior a 75 (posiblemente esdudiantes con estrés en clase, situación que se debería consultar).
1.9.6. Realice un análisis comparativo entre el tiempo que se demorarán en ducharse los estu-
diantes hombres y las estudiantes mujeres.
X: Tiempo en la ducha
M H
10 15
20 13
15 8
15 9
10
11
12
9
10
n1= 4 n2=9
Medidas de dispersion
s1²=[(10–15)²+(20–15)²+(15–15)²*2]/3=
16.57
s = 4.08 min
Cv1= (4.08/15)*100= 27.2% moderada
Rango 1 = 20 - 10 = 10 [min]
1.9.7. Realice un análisis comparativo entre los pesos (kg) de estudiantes hombres en dos
estratos por edades, según los datos de la tabla.
Estrato 1= estudiantes con el menor o igual que 22 años
Estatus 2= estudiantes con edades mayores a 22 años
X: peso (Kg)
27
Estrato 1 Estrato 2
70 59
64,4 49
56,6 59
68 74
57,4 68
63 72
67,5 61
78
58
66
74
67
65
72
n1= 14 n2= 7
28
Tabla de cálculos para hallar las medidas de forma.
Pesos xi- x (xi-x)³ni (xi-x)4ni
56.6 -9.6 - 88 4.736 84 93. 4659
57.4 - 8.8 - 68 1.47 2 5996. 9536
58.0 - 8.2 -55 1.36 8 45 21.1176
63.0 - 3.2 -32.7 68 164. 8576
64.0 - 1.8 - 5.83 2 10.49 66
65.0 - 1.2 - 1.72 8 2.0 736
66.0 - 0.2 - 0.008 0.00 16
67.0 0.8 0.51 2 0.40 96
67.3 1.3 2.197 2.85 61
68 1.8 3.832 10.49 66
70 3.8 54.8072 208.5136
72 5.8 195.112 1131.64 96
74 7.8 47.552 3700.50 52
78 11.8 16 43.0 32 1938 7.770
Total 218.197 4357 2.27 39
Resumen de resultados
Estrato 1 Estrato 2
X 66.20 66.73
Me 66.5 68
Mo No existe {59.74}
Rango 21.4 15
S 6.23kg 6.92kg
s² 38.81 47.89
CV 9% 10%
P25% 63kg 59%
α³ 0.081 -0.1259
α4 -0.3013 1.4820
Interpretación
Prácticamente los estudiantes con edades hasta de 22 años tienen pesos que presentan sesgo
ligeramente hacia la derecha mientras que el grupo de estudiantes mayores de 22 años tienen un
ligero sesgo hacia la izquierda. Para el primer estrato, la distribución es platicúrtica, mientras que
para el Segundo grupo es leptocurtica.
29
1.9.8. Realice un análisis descriptivo de la variable “distancia recorrida (metros) en el test de
Cooper” aplicada a una muestra de 23 estudiantes de la PADFE. Usar Excel.
Nombre distancia frecuencia cardíaca máxima edad civil o militar
Francisco 2960 193 32 * militar
Bryan 2500 180 22 civil
Stalin 2450 181 19 civil
Ariel 2600 185 19 civil
Richard 2525 170 20 civil
Daniel 2900 188 21 civil
Edith 3015 185 29 * militar
Andrés 2300 170 20 civil
Michael 2250 81 21 civil
Paulo 2500 181 20 civil
Cristopher 2573 201 19 civil
Leonardo 2410 196 19 civil
Jairo 2600 161 29 * Militar
Ismael 2600 185 20 civil
Cristian 2500 170 20 civil
Sebastián 2395 180 21 civil
Jordi 2650 204 31* Militar
Marlon 2300 196 21 civil
Jorge 2615 191 22 civil
Raúl 2410 199 22 civil
Jimmy 2850 193 23 civil
Pamela 2200 192 21 civil
Diana 2300 215 19 civil
30
1.10. Ejercicios propuestos
1.1. ¿Cuál es la diferencia entre población y muestra?
1.2. Explique la diferencia entre variables cualitativas y cuantitativas
1.3. Explique la diferencia entre variables discretas y continuas
1.4. En las siguientes variables identifique, su tipo y el nivel de medida
Variable Tipo Nivel de medida
a. Número de grietas superficiales Discreta Razón
b. Estado civil ________________ ________________
c. Peso [Kg] ________________ ________________
d. Ingresos mensuales ($) ________________ ________________
e. Número de mascotas en casa ________________ ________________
f. Distancia para llegar a casa. ________________ ________________
g. Nivel en la carrera ________________ ________________
h. Temperatura (°C) ________________ ________________
i. Resistencia () ________________ ________________
j. Velocidad (km/h) ________________ ________________
31
d. Sexo,
e. Nivel de Educación
1.7. Diseñe una ficha de observación sobre algunas características de automóviles.
1.8. Diseñe una ficha de observación sobre algunas características en una competencia de
100 metros velocidad natación.
1.9. ¿Cuál es la diferencia entre frecuencia absoluta y frecuencia relativa?
1.10. ¿Qué es una marca de clase?
1.11. ¿Puede ser el número de clases un número decimal?
1.12. Si el tamaño de la muestra es 60, ¿cuántas clases recomendaría?
1.13. ¿Qué tipo de gráficos se utilizan para las variables cualitativas y discretas?, ¿Por qué?
1.14. ¿Cuál es la diferencia entre un histograma y un gráfico de barras?
1.15. Consulte sobre datos de población por sexo y realice un pictograma
1.16. Consulte sobre datos de población por género y realice un pictograma
1.17. Complete y analice la variable X= Número de Alumnos de la ESPE
1.19. Los siguientes datos corresponden a los salarios (en dólares) de un grupo de ejecutivos
de nivel medio en:
185 196 257 274 282 299 273 186 281 221
232 299 322 201 230 242 197 252 258 323
187 275 289 198 225 234 253 268 314 323
a. ¿Qué porcentaje de ejecutivos tienen salarios de al menos 290 dólares?
b. Realice el diagrama de Tallo y Hojas
c. Realice la distribución de frecuencias en clases, el histograma de frecuencias.
32
1.20. Los siguientes datos representan las observaciones referentes a colegiaturas (en $000)
para residentes fuera del estado en 60 colegios y universidades de Texas.
7.2 4.9 10.7 6.4 4.8 4.7 4.6 6.0 5.4 10.4
4.8 4.7 8.3 4.8 8.3 6.4 6.6 4.5 8.0 3.8
3.6 2.4 8.5 7.7 4.9 8.6 12.0 4.9 7.0 8.8
11.0 4.9 3.9 4.4 4.9 4.9 8.0 3.6 7.4 4.9
7.9 4.9 5.8 11.6 10.3 3.4 3.9 5.0 3.9 3.9
8.0 3.5 4.9 4.1 3.9 3.5 4.8 5.9 3.6 5.8
Tomado del American’s Best College 1994 College Fuide”. U.S. News & World Report
Realice:
a. Diagrama de tallo y hojas
b. Diagrama de cajas
b. Tabla de distribución de frecuencias
c. Histograma de frecuencias
d. Resumen de todas las medidas descriptivas.
e. Repita el ejercicio, usando Excel
f. Repita el ejercicio, usando PSPP
1.21. Ejercicio 42, capítulo 2 del texto “Estadística para Administración y Economía”, Ma-
son/Lind/Marchal. Supuestamente un cereal para desayuno incluye 200 pasas en
cada caja. Una muestra de 60 cajas, el día de ayer, mostró el siguiente número de
pasas en cada caja. (Ejercicio 42, Cap. 2 “Estadística para Administración y Econo-
mía”, Mason/Lind/Marchal). Analice los datos de las videocámaras a través de una
distribución de frecuencias.
191 195 196 198 198 199 200 200 200 201 202 203 204 205 206
193 195 197 198 199 199 200 200 201 202 202 203 204 205 206
193 196 197 198 199 200 200 200 201 202 202 204 205 206 206
193 196 197 198 199 200 200 200 201 202 203 204 205 206 207
1.22. Ejercicio. Prob. Y Estadistica aplicada a la Ing., Douglas Montgromery, George Run-
gerCap.1, Ejerc. 1.7. Un artículo publicado en Tecnnometrics (Vol. 19, 1977, pág. 425)
presenta los datos siguientes sobre el octanaje de varias mezclas de gasolina.
83,4 87,7 88,5 89,3 89,9 90,5 91,1 91,8 92,7 94,2
84,3 87,8 88,6 89,6 90,0 90,6 91,1 92,2 92,7 94,4
84,3 87,9 88,7 89,7 90,1 90,7 91,2 92,2 93,0 94,7
86,7 88,2 88,9 89,8 90,1 90,8 91,2 92,3 93,2 96,1
86,7 88,3 88,9 89,8 90,3 90,9 91,5 92,3 93,3 96,5
86,7 88,3 89,0 89,8 90,4 91,0 91,5 92,6 93,3 98,8
33
87,4 88,3 89,2 89,9 90,4 91,0 91,6 92,7 93,4 98,8
87,5 88,4 89,2 89,9 90,4 91,0 91,6 92,7 93,7 100,3
87,6 88,5
Realice lo siguiente:
a. Diagrama de tallo y hojas
b. Diagrama de caja
c. Tabla de distribución de frecuencias
d. Histograma de frecuencias
e. Resumen de todas las medidas descriptivas
f. Repita el ejercicio, usando Excel
g. Repita el ejercicio, usando R-Studio
Realice lo siguiente:
a. Diagrama de tallo y hojas
b. Diagrama de caja
c. Tabla de distribución de frecuencias
d. Histograma de frecuencias
e. Resumen de todas las medidas descriptivas
f. Repita el ejercicio, usando Excel
h. Repita el ejercicio, usando R-Studio
1.24. Con los datos de los pesos en libras usado en el ejemplo de pesos de personas sometidas
a pruebas físicas:
a. Agrupe estos pesos en las siguientes categorías: Delgado: ≤ 135 libras, Normal: ]135,
160], obeso 1: ]160, 185], obeso 2: >185 libras.
b. Con esta clasificación elabore una tabla de frecuencias y un gráfico de barras.
1.25. Realice una encuesta sobre un tema de interés relacionado con su ámbito de estudios
con 10 preguntas. Aplique la encuesta con formulario google docs. Realice el informe.
34
1.11. Deber
Realice los siguientes ejercicios propuestos:
- Ejercicios 1.1 al 1.5 (papel, esferos, calculdora)
- Ejercicios 1.17, 1.18 (Excel)
- Ejercicio 1.21 ((papel, esferos, calculdora, pero en los literales de media, desviación es-
tándar, coeficiente de asimetría, curtosis, tabla de frecuencia, hacerlo en Excel)
- Ejercicio 1.22 (Excel)
- Ejercicio 1.23 (En la interfaz R-Studio para R)
Bibliografía
Scheaffer, R., y Mendenhall, W. (2012). Elementary Survey Sampling. Seventh Edition. (pp.
7-15, pp. 217-220). University of Florida: Emeritu.
Montgomery, D., y Runger, W. (2012). Elementary Survey Sampling. Seventh Edition. (pp. 7-
15, pp. 217-220). University of Florida: Emeritu.
Scheaffer, R., y Mendenhall, W. (2012). Elementary Survey Sampling. Seventh Edition. (pp.
7-15, pp. 217-220). University of Florida: Emeritu.
Lind D., Marchal W., Wathen S., (2012). Estadística Aplicada A Los Negocios y La Econo-
mía. Décimo quinta Edición. McGraw-Hill/Interamericana Editores.
35