0% encontró este documento útil (0 votos)
263 vistas38 páginas

Guía de Estadística Descriptiva

Este documento presenta un resumen de los conceptos básicos de estadística descriptiva. Introduce los conceptos clave de población, muestra, variable, tipos de variables (cuantitativas y cualitativas), y niveles de medida. Explica cómo las variables pueden clasificarse como discretas o continuas dependiendo de si toman valores numéricos finitos o infinitos. Además, describe los diferentes métodos para organizar y resumir datos estadísticos, incluidas tablas, gráficos y medidas descriptivas.

Cargado por

Beto Bryan Lino
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
263 vistas38 páginas

Guía de Estadística Descriptiva

Este documento presenta un resumen de los conceptos básicos de estadística descriptiva. Introduce los conceptos clave de población, muestra, variable, tipos de variables (cuantitativas y cualitativas), y niveles de medida. Explica cómo las variables pueden clasificarse como discretas o continuas dependiendo de si toman valores numéricos finitos o infinitos. Además, describe los diferentes métodos para organizar y resumir datos estadísticos, incluidas tablas, gráficos y medidas descriptivas.

Cargado por

Beto Bryan Lino
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadística Descriptiva

Dra. Patricia Guevara Vallejo


Docente del DECE
Universidad de las Fuerzas Armadas -ESPE

Diciembre 2020
ÍNDICE
Resumen _________________________________________ ii
Capítulo 1. Introducción a la Estadística __________________ 1

1.1. Introducción a la Estadística _____________________________1

1.2. Conceptos básicos _______________________________________1

1.3. Fuentes de información__________________________________3

1.3.1. La Encuesta _______________________________________________________3

1.4. Tabulación de los datos __________________________________4

1.5. Tabla de distribución de frecuencias ______________________6

1.5.1. Distribución de frecuencias para el caso discreto o variables cualitativas ________6

1.5.2. Distribución de frecuencias para el caso continuo __________________________6

1.5.3. Distribución de frecuencias usando programas estadísticos __________________9

1.6. Gráficos estadísticos ___________________________________ 10

1.7. Tablas de contingencia _________________________________ 12

1.8. Medidas descriptivas ___________________________________ 14

1.8.1. Medidas descriptivas para datos agrupados _____________________________ 14

1.8.1.1. Medidas de tendencia central ___________________________________ 14

1.8.1.2. Medidas de dispersión _________________________________________ 18

1.8.1.3. Medidas de posición __________________________________________ 19

1.8.1.4. Factores de forma ____________________________________________ 20

1.9. Ejercicios resueltos ____________________________________ 23

1.10. Ejercicios propuestos ___________________________________ 31

1.11. Deber _________________________________________________ 35

I
Resumen

Probabilidades y Estadística es un compendio de la asignatura de Probabilidades y Es-


tadística que se dicta en las carreras de la Universidad de las Fuerzas Armadas – ESPE. En
términos generales la teoría puede ser usada por cualquier carrera, pues los conceptos son
los mismos, sin embargo, cada estudiante podrá complementar este documento con otros,
en función de sus necesidades de contenido y profundidad. Obviamente las aplicaciones, si
son específicas para cada carrera, por lo que este documento solo sería una guía para los
estudiantes de aquellas carreras para los que no fue diseñado.

El documento se ha organizado en capítulos, que se irán tratando a lo largo de las tres


unidades en las que se organiza la asignatura.

En el primer capítulo se trata de la parte descriptiva de la Estadística, donde se definirán


los conceptos básicos de variables, tipos y el tratamiento de los datos mediante tablas, grá-
ficos y resúmenes descriptivos. En el segundo capítulo se introducen los conceptos básicos
de probabilidades y sus reglas, así como las técnicas de conteo, para aplicarlos en el cálculo
de las probabilidades de problemas básicos. En el capítulo tres, se estudiarán las variables
aleatorias tanto discretas como continuas, y una vez identificadas, calcular las probabilida-
des usando la distribución de probabilidad adecuada. En el capítulo cuatro, se introduce la
estimación de parámetros como primer elemento de la Estadística inferencial, para una va-
riable aleatoria, así como también una introducción en el muestreo probabilístico. En el
capítulo cinco se estudiarán las pruebas de hipótesis sobre la media y la proporción. El ca-
pítulo seis, es una breve introducción sobre el modelo de regresión lineal simple, que sirve
de base para posteriores estudios de otros modelos de regresión simple.

En cada capítulo se desarrollan ejemplos con datos estadísticos relativos al grado aca-
démico de actividad física, y al final de cada capítulo se proponen ejercicios de refuerzo.

Al final del documento se tiene la sección de anexos de datos y tablas estadísticas.

II
Capítulo 1. Introducción a la Estadística

1.1. Introducción a la Estadística


Aunque en sus inicios la estadística se la utilizaba para comparar la riqueza de las naciones y
estudiar las características de las poblaciones a través de los censos, actualmente se constituye en
parte integral de las actividades de investigación en la mayoría de ciencias.

A continuación, se indican algunas aplicaciones de las herramientas estadísticas.


 En la agricultura, es una herramienta para estudios comparativos sobre reproducción de
plantas y animales, bondad relativa de ciertos fertilizantes, insecticidas, etc.
 En los negocios, se utiliza para realizar predicciones en ventas, estudiar la reacción de los
consumidores ante nuevos productos, tomar decisiones sobre inversiones.
 En salud y medicina, los resultados obtenidos a través de las técnicas estadísticas ayudarán
a decidir la conveniencia de aplicación de diferentes fármacos.
 En la industria, es importante dentro del área del control de calidad.
 En el área de la educación, psicología y sociología, permite comparar la conducta, actitu-
des, inteligencia, grupos socioeconómicos y culturales, entre otros.

1.2. Conceptos básicos


La estadística es una parte de las matemáticas, compuesta por un conjunto de herramientas
que ayudan en la toma de decisiones, a través de la recopilación, organización, análisis e interpre-
tación de la información.

La población o universo de estudio es el conjunto de elementos o unidades de observa-


ción que tienen características comunes y que son objeto de estudio. El tamaño de la población es
denotado por N. Algunos ejemplos de población son: estudiantes de primer nivel de la modalidad
presencial de las universidades públicas, deportistas que son beneficiados de el Plan de alto ren-
dimiento en el Ecuador.

La muestra es una parte representativa de la población, que ha sido seleccionada para el


análisis. Resulta conveniente estudiar una muestra cuando el tamaño de la población es relativa-

1
mente grande. El tamaño de la muestra es denotado por n. De los ejemplos anteriores de pobla-
ción las muestras serían de inferior tamaño y que se son seleccionadas con técnicas de muestreo
que podrían ser probabilísticas y no probabilísticas. Cabe aclarar que los resultados obtenidos con
las técnicas no probabilísticas están restringidos a la misma muestra, es decir no se pueden ex-
tender a la población, al no poder determinar adecuadamente de un error de muestreo.

Variable es una característica de la unidad de observación, se la puede representar con letras


mayúsculas usualmente X, Y, Z, aunque pueden ser otras letras, e incluso usar letras mayúsculas
con subíndices: X1, X2, …, Xp según como sea conveniente. Los valores que toma una variable, se
denotan por letras minúsculas, de modo que, si X es la variable, sus n valores serán x1, …, xn.
Ejemplos de variables: X: Materias de preferencia, Y: edad, Z: número de créditos que toma.
X1: x11, x21, …., xn1
Las variables se clasifican en cuantitativas y cualitativas. La variable cuantitativa, es suscep-
tible de medición, es decir toma valores numéricos; si la variable toma un número finito de valores
se dice Discreta, como, por ejemplo: número de hijos por familia, número de empleados en la
empresa, número de materias aprobadas, número de estudiantes que llegan tarde a clase en aulas
de 25. Si la variable toma un número infinito de valores en el conjunto de los números reales, se
dice Continua, como, por ejemplo: estatura (m), peso (kg), sueldo ($), índice de masa corporal.

Las variables cualitativas no son susceptibles de medición, solo toman atributos o cualidades.
Ejemplo: género (Femenino, Masculino), nivel de estudios alcanzados (Bachillerato, Pregrado,
Posgrado), color de ojos (negro, azul, verde, …). El tratamiento de las variables, está limitado a su
tipo y además a los niveles de medida que estas poseen. Estos niveles se exponen a continuación:

El Nivel de razón (Escala) se identifica por tener el cero es absoluto, es decir corres-
ponde a la ausencia de medida, por lo que existe una relación de orden. Por ejemplo, el número
de hijos por familia es una variable que tiene un cero absoluto.
El Nivel de intervalo, se presenta cuando, el cero es relativo. El cero no significa ausen-
cia de medida. Por ejemplo: Temperatura (oF) no significa ausencia de temperatura; consumo
mensual de energía eléctrica (Kw).
Nivel Ordinal, corresponde a valores de orden. Por ejemplo, a) podemos estudiar la va-
riable “nivel de satisfacción de un producto”, como muy satisfactorio, satisfactorio, poco satis-
factorio. b) rango profesional, calificación.
Nivel Nominal, corresponde a variables cuyos atributos son simples etiquetas. La rela-
ción es de igualdad entre los atributos de la variable. Por ejemplo, a) la variable raza, toma
valores tales como: blanca, negra y otro tipo de razas. b) sexo, c) síndromes psicológicos (neu-
rosis, depresión, entre otros).

2
Tipos de variables

Cuantitativas Cualitativas
Subtipo:

Discretas Continuas

Niveles de medida Niveles de medida

Razón Intervalo Nominal Ordinal

Observación: Los diferentes valores que toma la variable pueden codificarse utilizando una es-
cala alfabética o numérica. Por ejemplo, la variable género toma dos valores, que pueden ser co-
dificados como: Masculino = 1, Femenino = 2; o masculino = m, femenino = f.

Los parámetros y los estadísticos son medidas estadísticas que describen a la variable
a través de una sola medida, si se obtienen de la población se dicen parámetros (, 2, , p), y si se
obtienen de la muestra se llaman estadísticos (x, s2, s, p̂ ).

1.3. Fuentes de información


La información puede recogerse a través de diferentes medios llamados en general: fuentes pri-
marias, y fuentes secundarias. Las fuentes primarias permiten obtener información directamente
de la unidad de observación y los instrumentos para obtenerla son: encuesta, entrevista, observa-
ción directa, experimentación, simulación, entre otras. Para cualquiera de estas fuentes, se debe
diseñar un cuestionario o ficha que permita obtener información que cumpla con los objetivos
descritos en la investigación. En el caso de las preguntas, éstas pueden ser de tipo: abiertas, ce-
rradas y mixtas. Las fuentes secundarias permiten obtener información de forma indirecta de la
unidad de observación. Los instrumentos para obtener esta información son: fuentes bibliográfi-
cas, revistas, periódicos, y más documentos similares tanto impresos como digitales.

1.3.1. La Encuesta
Existen varios instrumentos para recoger la información, pero en esta ocasión solo hablare-
mos de la encuesta. “La encuesta es una técnica que se lleva a cabo mediante la aplicación de un
cuestionario a una muestra de personas. Las encuestas proporcionan información sobre las opi-
niones, actitudes y comportamientos de los ciudadanos”

La encuesta se puede diseñar tomando en cuenta los siguientes elementos básicos:

- Encabezado, donde se identificará el nombre de la institución o grupo que aplica la en-


cuesta, el código o número de encuesta, en ocasiones el nombre del encuestador.

3
- Objetivo general de la investigación
- Instrucciones sobre la forma de responder a las pregunta, tiempo y recomendaciones
- Datos informativos, que corresponden a la identificación del estrato a encuestar
- Cuerpo de la encuesta, que puede estar organizada en secciones, pudiendo corresponder
a objetivos específicos o áreas a consultar.

Se recomienda redactar este documento con lenguaje claro y acorde al grupo a quien va diri-
gida la encuesta. No excederse en las preguntas para no cansar y así evitar respuestas apresu-
radas sin tomarse el tiempo necesario para dar una respuesta real. hacer preguntas claras, a
fin de evitar confusión en la pregunta y por ende en la respuesta, no preguntas ambiguas, no
preguntas compuestas por dos ideas. No cambiar la forma de preguntar en positivo a negativo
o de escala ascendente.

1.4. Tabulación de los datos


Previo al diseño de la encuesta, se deben definir las posibles repuestas de los encuestados, lo
que permite saber la forma de preguntar, para tener claro la escala de medida y unidad de medida
en las preguntas asociadas a variables cuantitativas, así como las codificaciones a usar en el caso
de que las preguntas sean cerradas, en este caso resulta conveniente usar codificaciones numéri-
cas, especialmente para el uso de ciertos programas estadísticos como por ejemplo SPSS.

4
Ejemplo 1.1.

Similar a la descripción dada en la tabla 1., añada más variable y complete la información.

Tabla 1. Codificación de preguntas y respuestas de la encuesta

N. Pregunta Tipo de pre- Código Tipo de Nivel de Códigos de res-


gunta pregunta variable medida puestas.
1 Lugar de procedencia Abierta P1_lugar Cadena Nominal Ninguna
(país / ciudad)
2 ¿En qué zona está ubi- Cerrada, selec- P2_zona Cualitativa Nominal 1. Urbana
cada su residencia? ción simple 2. Rural
3 Sexo Cerrada, selec- P3_sexo Cualitativa Nominal 1. Femenino
ción simple 2. Masculino
4 Edad Abierta P4_edad Cuantita- Razón
tiva
:
.
10 ¿Cuál sería su nivel de Cerrada P10_sat Cualitativa Ordinal 1. No satisfecho
satisfacción con el sen- 2. Poco Satisfecho
dero hasta llegar a la 3. Moderadamente
cascada? Asigne un va- satisfecho
lor del 1 al 5, donde 1 es 4. Muy satisfecho
lo más bajo y 5 lo más 5. Extremadamente
alto. satisfecho
11 ¿Cuánto estaría dis- Abierta P11_pago Cuantita- Razón
puesto a pagar un plato tiva
típico en un lugar de co-
midas cercano al in-
greso a la cascada?
Fuente: (2020), Elaboración propia

En la pregunta 11, se ha usado la escala de Likert, la misma que está formada por 3 o más
valores (puntaje) por lo general impares hasta el 9, que ayudan a expresar de forma ordinal las
opiniones, en este rango, se incluye un valor central o neutral. Una vez diseñada la matriz de da-
tos, y luego de aplicar la encuesta, se procede a tabular los datos en el programa estadístico que
se haya elegido, tomando en cuenta para ello el tipo de variables y sus niveles de medida. Recordar
que, si se elige una codificación numérica para los atributos de una variable cualitativa, esto solo
se lo hacer por facilidad en el ingreso de los datos, pero nunca tendrá el tratamiento de una varia-
ble cuantitativa.

Tabla 2. Matriz de datos de la encuesta

P1_lugar P2_zona P3_sexo P4_edad ……. P10_sat P11_pago


Perú/Lima 1 1 45 8 3
Ecuador/Ambato 1 2 31 7 2.5
Ecuador/Ambato 1 1 35 9 3.5
Ecuador/Sangolquí 2 1 18 9 1
Fuente: (2020), Elaboración propia.

5
1.5. Tabla de distribución de frecuencias
Una vez creada la matriz de datos, se pude iniciar con el análisis estadístico, empezando desde
lo básico que sería una tabla de frecuencias.

Una tabla de distribución de frecuencias, es la representación de las observaciones individua-


les o agrupadas en clases con sus respectivas frecuencias. Se usa tanto para variables cualitativas
como cuantitativas. Dada una variable de estudio X con n valores x1, x2, . . ., xn, la distribución de
frecuencias puede contener:
 Frecuencia absoluta (ni), que es el número de veces que se repite un valor específico de la
variable.
 Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el número total de obser-
vaciones, es decir: ni/n

 Frecuencia absoluta acumulada (Ni = n


xi
i ), que es el valor acumulado de las frecuencias

absolutas hasta llegar a un valor específico xi de la variable.

 Frecuencia relativa acumulada (Fi = f xi


i ), que es el valor acumulado de las frecuencias

relativas hasta llegar a un valor específico xi de la variable.

1.5.1. Distribución de frecuencias para el caso discreto o variables cualitativas


Puesto que las variables cualitativas y cuantitativas discretas toman pocos valores, la cons-
trucción de una tabla de distribución de frecuencias solamente implica representar en una co-
lumna los valores de la variable y en las demás columnas sus respectivas frecuencias.

Ejemplo 1.2
Tabla 3. Distribución de asignaturas por preferencia

Asignatura preferida ni fi Ni Fi
Matemáticas 12 0.24 12 0.24
Física 18 0.36 30 0.60
Química 20 0.40 50 1.00
TOTAL: 50 1.00

1.5.2. Distribución de frecuencias para el caso continuo

Para el caso continuo, la distribución de las frecuencias, requiere primero la determinación de


un número apropiado de clases o intervalos k, para un conjunto de datos de tamaño n. Uno de
los métodos que existen, se presenta a continuación.

Los pasos que se deben seguir para construir una distribución de frecuencias son:

6
1. Elegir el número de clases k = 1+3.322 * log(n)  Fórmula de Sturguess
2. Hallar la longitud de los intervalos L = Rango/k = (xmáx – xmín)/ k
L se elegirá de manera conveniente de modo, que se conserve el número de clases, por lo
que no siempre se seguirán reglas de redondeo; siempre y cuando no se tome un valor
demasiado alto, se debe considerar el rango de variación de los datos.
3. Fije el límite inferior de la primera clase li tal que li ≤ xmín.
Determine el límite superior de la última clase, ls tal que ls ≥ xmax, donde ls = li +k*L
En el caso de obtener un exceso, es decir si ls > xmax, este se repartirá de forma equitativa
en los extremos inferior y superior de la primera y última clase.
4. Construya la tabla, definiendo intervalos semiabiertos, es decir (li, ls]

Ejemplo 1.3
Con los pesos en libras de un grupo de personas que se están sometiendo a unas pruebas físi-
cas, construya una tabla de distribución de frecuencias y discuta los resultados hallados.
133 133 135 136 137 138 140 140 141 142 143 143
143 144 144 144 146 146 147 148 148 148 148 149
149 149 149 150 151 151 151 152 153 153 153 153
154 154 155 155 155 155 156 156 156 156 157 158
158 158 159 159 160 160 161 162 163 164 166 166
167 168 170 172 175 176 178 178 180 180 181 181
185 186 187 189 190 191 192 192 192 199 200 201
204 205 206 208 210 211

Solución
1. Número de clases: k = 1 + 3.322*log(90) = 7.49 k=7
2. Rango = 211 – 133 = 78  Longitud de clases L = R/k = 78/7 = 11.14
3. Límite inferior de la primera clase y superior de la última clase:
Límite inferior de la primera clase li = 133  ls = 133+7*11.14 = 210.98, no con-
tiene al último dato, por lo que se toma un valor más grande de L, así L =12.
Tome en cuenta la precisión o el rango de los datos para no exagerar en la longitud de L.
Luego: ls = 133+7*12 = 217  exceso = e = 6, que se repartirá 3 en cada extremo.
Por lo que: li = 133-3 = 130 y ls = 211+3 = 214
4. Construcción de la tabla con intervalos de tipo ] li, ls], es decir, abiertos a la izquierda y
cerrados a la derecha. El límite inferior será cerrado solamente cuando, el límite inferior
de la primera clase, coincida con el valor mínimo de la variable. A continuación, se pre-
senta la tabla como resultado del proceso aplicado.

7
Tabla 4. Tabla de frecuencias de pesos de personas, sometidas a pruebas físicas, con exceso = 6

N. Clases Marca de Clase ni fi Ni fi Fi % % Acum.


ABS.
1 130 - 142 136 9 0.100 9 0.100 0.100 10.00 10.00
2 142 - 154 148 27 0.300 36 0.300 0.400 30.00 40.00
3 154 - 166 160 22 0.244 58 0.244 0.644 24.44 64.44
4 166 - 178 172 8 0.089 66 0.089 0.733 8.89 73.33
5 178 - 190 184 10 0.111 76 0.111 0.844 11.11 84.44
6 190 - 202 196 8 0.089 84 0.089 0.933 8.89 93.33
7 202 - 214 208 6 0.067 90 0.067 1.000 6.67 100.00
TOTAL: 90 1.000 1.000 100.00

Se añadió la columna de la marca de clase es el punto medio del intervalo (xi = (li+ls)/2), que
será utilidad para hallar más adelante medidas descriptivas para datos agrupados.

 Existe una mayor concentración de observaciones en las primeras tres categorías, y repre-
sentan el 64.44% del grupo estudiado con pesos inferiores a 166 libras.
 En las tres últimas categorías se encuentran las personas con pesos mayores o iguales a 178
libras y representan el 26.7%

Ejemplo 1.4
Considerando el ejemplo anterior, se quiere un exceso más pequeño, por lo que se toma
de forma conveniente L =11.2, y se conserva el número de clases.

Paso 3: e = L*k – R = 11.2*7 – 78 = 78.4 – 78 = 0.4 , este exceso será repartido equitativa-
mente en los extremos inferior y superior de la tabla: li =133-0.2 = 132.8, ls =211+0.2 =211.2
Paso 4: Construir la tabla:
Clases Li ls Marca Clase ni Ni fi Fi
1 132,8 144,0 138,4 16 16 0,1778 0,1778
2 144,0 155,2 149,6 26 42 0,2889 0,4667
3 155,2 166,4 160,8 18 60 0,2000 0,6667
4 166,4 177,6 172,0 6 66 0,0667 0,7333
5 177,6 188,8 183,2 9 75 0,1000 0,8333
6 188,8 200,0 194,4 7 82 0,0778 0,9111
7 200,0 211,2 205,6 8 90 0,0889 1,0000
90 1,0000

8
El método del exceso es más largo, pero resulta más exacto. Sin embargo, al momento de uti-
lizar programas estadísticos el número de clases no siempre coincidirá, pues estos programas po-
drían usar otros métodos o algoritmos.

Otros métodos: El número de clases k, se toma de modo que sea el número entero más pe-
queño que cumple con 2k  n.

1.5.3. Distribución de frecuencias usando programas estadísticos

Salida de Excel. Los límites de las clases se obtienen por defecto.


Clase Frecuencia
133.00 2
141.67 7
150.33 19
159.00 24
167.67 9
176.33 5
185.00 7
193.67 8
202.33 3
Y mayor... 6

Excel permite también utilizar las clases construidas por el usuario, eligiendo rango de clases,
que simplemente es el conjunto de límites superiores construidos con las fórmulas.

Salida de SPSS (Statistical Packaged ofd social sciences). El número se obtiene por defecto
solamente, pero los datos se distribuyen de forma individual y no en clases como en los casos
anteriores. A continuación, se presenta parte de la tabla de frecuencias.

Frequency Percent Valid % Cumulative %


133 2 2.22 2.22 2.22
135 1 1.11 1.11 3.33
136 1 1.11 1.11 4.44
. . . . .
: : : : :
208 1 1.11 1.11 97.78
210 1 1.11 1.11 98.89
211 1 1.11 1.11 100.00
Total 90 100 100

9
1.6. Gráficos estadísticos
El gráfico a escoger dependerá del tipo de variable, según el esquema siguiente:

 Barras
Variables cualitativas  Pastel
 Pictogramas

 Histogramas
Variables cuantitativas  Líneas
 Caja
 Tallo y Hojas
 Dispersión

Variables cualitativas o discretas


 Gráfico de Barras. - Las barras tienen bases son de igual longitud y el alto corresponde a
la frecuencia de cada observación. Las barras deben ir separadas porque corresponden a
atributos de carácter cualitativo o datos discretos.
 Gráfico de pastel. - El 100%
Variables de los datos se distribuye en los 360º de la circunferencia
cuantitativas
 Pictogramas. - Las frecuencias se representan con objetos, personas, etc.

Variables cuantitativas
 Histograma de frecuencias. - Las barras deben ir juntas porque corresponden a datos con-
tinuos. Las frecuencias pueden ser absolutas o acumuladas.
 Polígono de frecuencias. - Se obtiene por la unión de las marcas de clase en los techos de
cada barra ya sea del histograma de frecuencias relativas o relativas acumuladas.
 Línea. - Representa pares ordenadas, se usa para datos cuantitativos como series de
tiempo, ayudando a estudiar la tendencia.
 Gráfico de dispersión. - Representa parejas de datos cuantitativos (x, y) para estudiar la
relación entre dos variables.
 Gráfico de caja. - Es una caja que contiene en forma ordenada las medidas descriptivas
como la media, mediana, cuartil uno y cuartil tres. Ayuda a estudiar el tipo de sesgo de la
distribución.
 Diagrama de tallo y hojas. - Es la representación de los datos con sus respetivas frecuen-
cias. En el tallo se pueden ubicar los datos correspondientes a ciertas unidades de decena,
centena o enteros, etc., mientras que en las hojas se distribuyen las unidades inferiores
(resto de dígitos).

Ejemplos de gráficos estadísticos para una variable:

10
Gráfico de barras de la asignatura preferida Gráfico de pastel del deporte practicado.

Pictograma Polígono de frec. absolutas de pesos

Histograma de frec. absolutas de pesos Diagrama de caja de los pesos de las personas
que están sometidas a pruebas físicas.
220

200

180

160

140

pesos

Diagrama de tallo y hojas de Pesos de las personas que se han sometido a pruebas físicas)

TALLO HOJAS Pesos de las personas que se han sometido a pruebas físicas)
13 335678
14 001233344466788889999
15 011123334455556666788899
16 0012346678
17 02568800115679
18 00115679
19 012229
20 014568
21 01
(En tallo se han colocado las decenas y en las hojas las unidades)

11
1.7. Tablas de contingencia
Es una tabla cruzada, entre dos variables, las mismas que pueden ser cualitativas, discretas
o una combinación de las dos. Se utilizan para determinar de forma descriptiva si existe aso-
ciación entre dichas variables. La tabla está formada por f filas o atributos de la primera varia-
ble y c columnas o atributos de la segunda variable.

Tabla 5. Tabla de contingencia entre X y Y

Y Y1 Y2 …. Yc Subtotal
X
X1 O11 O12 …. O1c u1
X2 O21 O22 …. O2c u2
: : : : : :
: : : Oij : :
: : : : : :
Xf Of1 Of2 …. Ofc uf
Subotal v1 v2 …. vc n
Donde:

Xi: atributo i de la variable X

Yi: atributo j de la variable Y

Oij: Frecuencia observada (número de individuos que poseen a la vez los atributos Xi y Yj)

n: número de individuos en la muestra, o número de respuestas de los individuos a los atributos


comunes Xi y Yj.

A partir de esta tabla se pueden construir tablas de contingencia con porcentajes por filas, colum-
nas y del total.

Ejemplo 1.5
La siguiente tabla de contingencia muestra la relación entre las variables práctica de actividad
física y el nivel de ingresos, tomado del enlace web: http://cdeporte.rediris.es/revista/re-
vista5/artcalidad.html.
Tabla 13. Tabla de contingencias de las variables práctica deportiva según ingresos mensuales.

12
En la primera fila se observan las frecuencias observadas, las frecuencias esperadas que se
estudiarán más adelante y el porcentaje correspondiente en relación al total de respuestas. A con-
tinuación, se presentan unas variantes que se puede realizar a esta tabla, de las cuales realice la
interpretación:

Tablas cruzadas para las variables:


Filas: Nivel de ingresos
Columnas: Practica de actividad física.
Realiza actividad física
Si no Subtotal
Menos de 50000 1 2 3
Ingresos

50000, 100000 26 21 47
100000, 200000 10 4 14
200000, 300000 0 1 1
Subtotal 37 28 65

Tabla cruzada 1: Porcentaje respecto al total


Realiza actividad física
si no Subtotal
Menos de 50000 0,0154 0,0308 0,0462
Ingresos

50000, 100000 0,4000 0,3231 0,7231


100000, 200000 0,1538 0,0615 0,2154
200000, 300000 0,0000 0,0154 0,0154
Subtotal 0,5692 0,4308 1

Tabla cruzada 2: Porcentaje respecto a cada fila


Realiza actividad física
si no Subtotal
Menos de 50000 0,3333 0,6667 1,0000
Ingresos

50000, 100000 0,5532 0,4468 1,0000


100000, 200000 0,7143 0,2857 1,0000
200000, 300000 0,0000 1,0000 1,0000

Tabla cruzada 3: Porcentaje respecto a cada columna


Realiza actividad física
si no Subtotal
Menos de 50000 0,0270 0,0714
Ingresos

50000, 100000 0,7027 0,7500


100000, 200000 0,2703 0,1429
200000, 300000 0,0000 0,0357
Subtotal 1,0000 1,0000

Como se verá más adelante cada una de estas tablas representan probabilidades.

13
1.8. Medidas descriptivas

Otra herramienta de análisis estadístico son las medidas descriptivas, las mismas que permi-
ten sintetizar un gran número de datos en uno solo; ello proporciona una idea cuantitativa apro-
ximada de toda la distribución. Estas medidas descriptivas se las puede hallar tanto para los datos
distribuidos en tablas de frecuencias o intervalos, así como para datos distribuidos de forma in-
dividual.
Las medidas descriptivas, se pueden clasficar de la siguiente forma:

 Media
Tendencia Central  Mediana
 Moda
 Rango
Dispersión  Varianza
 Desviación estándar
Medidas Descriptivas  Coeficiente de variación

Posición  Cuartiles
 Deciles
 Percentiles
Forma  Asimetría
 Curtosis

1.8.1. Medidas descriptivas para datos agrupados

1.8.1.1. Medidas de tendencia central


Estas medidas tienden a situarse hacia el centro del conjunto de datos. Las más importantes
son: media, mediana y moda.

Media aritmética
Se define como el promedio de las observaciones.

Caso Media para datos no agrupados


Media muestral n

+ + ... + x n x i ∑𝑚
𝑖=1 𝑥𝑖 ∗𝑛𝑖
x = x1 x 2 = i 1  𝑥̅ = 𝑛
𝑥̅ = ∑𝑚
𝑖=1 𝑥𝑖 𝑓𝑖
n n
Media poblacional N

+ + ... + x N x i ∑𝑚
𝑖=1 𝑥𝑖 ∗𝑛𝑖
μ = x1 x 2 = i 1 𝜇 = 𝑁
𝜇 = ∑𝑚
𝑖=1 𝑥𝑖 𝑓𝑖
N N

14
Donde:
n es el tamaño de la muestra, N es el tamaño de la población
m es el número de datos diferentes
xi es la observación i
ni es la frecuencia absoluta i (número de veces que se repite el dato i)
fi es la frecuencia relativa, definida: fi= ni/n

La última expresión de la media, también se llama media ponderada, cuando el lugar de usar
la frecuencia relativa como la razón ni/n, se asigna de forma conveniente dicho valor.

Observaciones sobre la media:


 De utilidad si los datos son homogéneos.
 Es la medida de centralización más utilizada.
 Si la distribución posee valores atípicos, se produce un valor de la media distorsionado. En
ese caso es recomendable usar la media recortada al 5% o la mediana.

Ejemplo 1.6
La media para la muestra: 2, 4, 4, 5, 6, 7, 7 es
2  4 * 2  5  6  7 * 2 35 =5
x= =
7 7

Ejemplo 1.7
El curso de Estadísta considera 7 instrumentos de evaluación en cada unidad, con las ponde-
raciones que se indica a continuación. ¿Cuál sería la media ponderada?
Instrumento de eva- Ponderación
luación
Actuación en clase (AC) 10%
Lección diaria (LD) 10%
Taller (T) 10%
Deber (D) 10%
Prueba 1 (P1) 20%
Prueba 2 (P2) 20%
Prueba 3 (P3) 20%
Total ponderaciones: 100%

𝑥̅ = 0.10𝐴𝐶 + 0.10𝐿𝐷 + 0.10𝑇 + 0.10𝐷 + 0.20𝑃1 + 0.20𝑃2 + 0.20𝑃3

15
Mediana
Se denomina mediana al valor central de los datos cuando estos se han dispuesto ordenada-
mente.
Caso Mediana para datos no agrupados
Muestra Caso 1. Me = X(n+1)/2 con número de datos impar

Caso 2. Me = X( n / 2 )  X( n / 2 )1 con número de datos par


2
Población Reemplazar n por N

Muestra n=5  Me=X3 X1,X2,X3,X4,X5


Muestra n=4  Me= (X2+X3)/2 X1,X2,X3,X4

Ejemplo 1.8.
Halle la mediana para datos no agrupados con los siguientes datos:
Caso 1: 12, 14, 14, 15, 16, 17, 17. Me = X(7+1)/2 = X4 = 15.

Caso 2: 12, 14, 14, 15, 16, 17, 17, 17. Me = X (8/2)  X (8/2)1 = (15+16)/2 = 15.5
2

Observaciones sobre la mediana


 La mediana es útil si algún dato es muy extremo
 Es una medida que depende del orden de los datos y no del valor.

Moda
Es el valor o valores que tienen mayor frecuencia (aparecen el mayor número de veces). Puede
haber una, dos, tres o más modas, por lo que las distribuciones se llamarán respectivamente uni-
modal, bimodal, trimodal y multimodal. Si todos los datos se repiten una sola vez, o el mismo
número de veces, no hay moda.

Observaciones de la moda:
 Es interesante cuando su frecuencia se destaca respecto al resto de frecuencias.
 Importante en las variables cualitativas, por ser el único parámetro que se calcula.
 No siempre se sitúa en la zona central, pese a ser una medida de centralización.

Nota. - Las medidas descriptivas anteriores, se usan tanto para la población como para la
muestra, haciendo un simple cambio de n por N.

16
Ejemplo 1.9.
Con los datos de una muestra sobre la Resistencias en Ohmios de 100 bobinas, halle: (a) media,
(b) mediana y (c) moda, para el caso de datos no agrupados.
No. Resistencia en Ohmios Xi ni Xi.ni
1 32.7 1 p

2 32.8 1 n i xi
3 32.9 3 (a) x= i 1
=
n
4 33.0 5
5 33.1 9 (b) Me =
6 33.2 9
7 33.3 10 (c) Mo =
8 33.4  Mediana 12
9 33.5  Moda 14
10 33.6 13
11 33.7 8
12 33.8 6
13 33.9 4
14 34.0 2
15 34.1 2
16 34.2 0
17 34.3 0
18 34.4 1
TOTAL: 100 3339.6

17
1.8.1.2. Medidas de dispersión
Estas medidas reflejan la dispersión existente entre los datos y las medidas de tendencia cen-
tral. Para una variable estadística que toma los valores x1, x2, x3, ... , xn, con frecuencias absolutas
n1, n2, ..., nn respectivamente, se definen las siguientes medidas de dispersión:

Rango = Xmáx-Xmín

Desviación media
Es el promedio de las desviaciones de las observaciones respecto a la media.

Dm=  x i  x .n i
n
Varianza
Puesto que la desviación media no toma en cuenta la distribución de los datos, se introduce
esta nueva medida llamada varianza, que es el promedio de los cuadrados de las desviaciones de
los datos respecto a la media.
Varianza muestral Varianza poblacional
∑𝑚 2
𝑖=1(𝑥𝑖−𝑥̅ ) 𝑛𝑖 ∑𝑚 2
𝑖=1(𝑥𝑖−𝜇) 𝑛𝑖
𝑆2 = udd2 𝜎2 = 𝑁
udd2
𝑛−1

Desviación estándar
La desviación estándar o desviación típica se define como la raíz cuadrada de la varianza. Su
uso es adecuado para efectos de interpretación, ya está dada en las mismas unidades de la
variable de estudio e indica la dispersión tanto a la izquierda como a la derecha de la media.

En el caso de la muestra: s = S 2 (udd)

En el caso de la población: = σ 2 (udd)

Ejemplo 1.10
Halle la desviación estándar, para los siguientes datos: 2, 4, 4, 5, 6, 7, 7.
Solución: La media es x = 5.
La desviación estándar será: (2  5) 2  (4  5) 2 2  (5  5) 2  (6  5) 2  (7  5) 2 2 20
s   1.83
6 6

Coeficiente de variación
Este coeficiente también mide la dispersión en relación a la media, se mide en términos de
s
porcentaje. Útil para comparar dos muestras respecto a una misma variable. C.V = *100%.
x

18
Ejemplo 1.11

Por ejemplo, una muestra tiene: x = 30 y s = 4 y otra de x = 60 y s = 6 parece que en principio


la segunda es más dispersa. Para determinar cual tiene mayor variación hallamos sus coeficientes,
entonces CV1 = 4/30 = 0.13, CV2 = 6/60 = 0.10, lo que indica que, el primer grupo tiene
una variabilidad 3% más alta que el segundo grupo.

1.8.1.3. Medidas de posición

Así como la mediana divide a los datos de una distribución en dos partes iguales. También
existen otras medidas que dividen a la distribución hasta en cien partes.

Cuartiles (4 partes)
-----Q1-----Q2-----Q3-----
Se tienen tres cuartiles Q1, Q2 y Q3 y dividen al conjunto de datos en cuatro partes iguales.
Interpretación:
Q1, El 25% de los datos son inferiores a Q1, o, también, el 75% de los datos son superiores a Q1
Q3, supera al 75% de los datos, o Q3 es superado por el 25% de los datos.

Se observa que la mediana es el cuartil 2. Se puede hallar el rango intercuartil que está definido
como el intervalo que contiene al 50% de datos centrales, luego RI = Q3 – Q1. Medida es que no
está influenciada por los datos extremos.

Percentiles
Se tienen 99 percentiles y dividen al conjunto de datos en cien partes iguales.
En términos de proporción: 𝑋(𝑛+1)𝑝 siendo 0≤p≤1
En términos de porcentjae: 𝑋(𝑛+1)𝑝% siendo 0≤p%≤100
100%

Por ejemplo:
P50% = Me = X(n+1)(1/2) = X(n+1)(0.5) =

La posición del percentil, pude presentar uno de tres resultados: (n+1)*p

 Si es número entero, esa es la posición del percentil


 Si es un decimal intermedio entre dos valores enteros entonces halle el promedio entre esos
dos valores. Por ejemplo, si la posición resulta 7.5 como no hay dato X7.5, el percentil será el
promedio entre las posiciones 7 y 8.
 Si es un caso diferente a los anteriores, aproxime al entero más cercano.

19
Ejemplo 1.12.
Percentil 80% de un conjunto de 35 datos: X36*0.8= X28.8= X29.

Ejemplo 1.14
Con los datos de una muestra sobre la Resistencias en Ohmios de 100 bobinas, halle: a) Los
cuartiles b) los percentiles 5, 10, 90 y 95

a. X 25  X 91*0.25 = X22.75 = X23 = 33.2

X50 = X(91*0.50) = X45.5 = (X45 + X46)/2 = (33.4+33.4)/2 = 33.4


X75 = X(91*0.75) = X68.25 = X68 = 33.6

b. X5 = X(91*0.05) = X4.55 = X5 = X10 = X(91*0.10) = X9.1 = X9 =


X90 = X(91*0.05) = X81.9 = X82 = X95 = X(91*0.95) = X86.45 = X86 =

1.8.1.4. Factores de forma

Coeficiente de asimetría o de sesgo (3)


También se lo conoce como “momento centrado de orden tres” y mide el sesgo de las obser-
vaciones hacia un lado u otro de la distribución. Se denota con 3, tiene un punto crítico conside-
rado normal en α3 = 0. Se lo calcula a través de:
∑𝑚 ̅ )3 ∗𝑛𝑖
𝑖=1(𝑥𝑖 −𝑥
𝑛
𝛼3 =
𝑠3
𝑛 𝑥𝑖 −𝑥̅ 3
O también: 𝛼3 = (𝑛−1)(𝑛−2) ∑𝑚
𝑖=1( ) ∗ 𝑛𝑖
𝑠

De acuerdo al valor del sesgo existen tres tipos de distribuciones:


Sesgada a la izquierda (sesgo -) α3 < 0 Simétrica (sin sesgo) α3 = 0 Sesgada a la derecha (sesgo +) α3 > 0

Para distribuciones unimodales se tiene:


Una distribución sesgada a la izquierda, mientras x <Me
Una distribución sesgada a la izquierda, mientras x >Me

20
Coeficiente de curtosis o apuntamiento (α4)
También se lo conoce como “momento centrado de orden cuatro”, y mide el grado de concen-
tración de los valores en función del alargamiento (apuntamiento). Se lo denota con 4 y tiene un
punto crítico considerado normal en α4=3. Se lo calcula a través de:
∑𝑚 4
𝑖=1(𝑥𝑖 − 𝑥̅ ) ∗ 𝑛𝑖
𝛼4 = 𝑛
𝑠4
𝑛(𝑛+1) 𝑥𝑖 −𝑥̅ 4 (𝑛−1)2
O también: 𝛼4 = (𝑛−1)(𝑛−2)(𝑛−3) ∑𝑚
𝑖=1( ) ∗ 𝑛𝑖 − 3 (𝑛−2)(𝑛−3)
𝑠

De acuerdo al valor de la curtosis estadarizado α4’ = α4 – 3, existen tres tipos de distribuciones:


α 4 < 0 (Platicúrtica) α4 = 0 (Mesocúritica) α4 > 0 (Leptocúrtica)

En libros de estadística matemática, se analiza el coeficiente de curtosis sin estandarizar.

Ejemplo 1.15
Para una muestra de Resistencias en Ohmios de 100 bobinas, se han encontrado un resumen
de medidas descriptivas en STATGRAPHICS y el histograma de frecuencias con SPSS.

Estadísticas: resistencias
Sample size 100
Average 33.441
Median 33.45
Mode 33.5
Variance 0.09638
Standard dev. 0.31045
Minimum 32.7
Maximum 34.4
Range 1.7
Lower quartile 33.2
Upper quartile 33.6
Skewness 0.19857 o también

x -Mo)/S -0.1929 por ser unimodal


3 =(
0.15607
Kurtosis
0.92837
Coeficiente de variación

Histograma de Resistencias - SPSS

21
20

10

Std. D ev = , 31
Mean = 33,44
0 N = 100, 00
32, 75 33, 00 33, 25 33, 50 33, 75 34, 00 34, 25
32, 88 33, 13 33, 38 33, 63 33, 88 34, 13 34, 38

RESISTENCIA EN OH MIOS

a. Verifique los resultados

b. Interprete los resultados.

22
1.9. Ejercicios resueltos

1.9.1. Ejemplos de variables en el área de la acrividad física

Variable Tipo Nivel de me- Codificación Ejemplo


dida
Clasificación de ciclistas por or- Cualitativa Ordinal 1. Primero 2
den de llegada en la segunda 2. Segundo
etapa del Tour de Francia 2019 3. Tercero, …

Clasificación de ciclistas por pun- Cuantitativa Escala - 248


tos en el Tour de Francia 2019
Evaluación del entrenamiento Cualitativa Ordinal 1. Deficiente 1
2. Bueno
3. Excelente

Desportes practicados con fre- Cualitativa Nominal □ Fútbol □ Fútbol


cuencia □ Básquet □ Otros
□ Vóley
□ Natación
□ Otros

Tiempo en la prueba de 100m ve- Cuantitativa- Escala - 10,71 seg.


locidad en Atletismo. Olimpiadas continua
Rio2016 *

La velocista jamaiquina Elaine Thompson


ganó los 100 metros planos tras superar a
una de las favoritas, las dos veces cam-
peona olímpica, su compatriota Shelly-
Ann Fraser-Pryce, quien conquistó la me-
dalla de bronce.
Thompson, de 24 años, paró el cronómetro
a los 10,71 segundos.

Recuperado el 2 de abril 2020 de:


https://www.bbc.com/mundo/noticias-
america-latina-37075920

23
1.9.2. Ejemplos de variables meteorológicas

Variable Tipo Niv.mdi Codificación Ejemplo


da
Humedad relativa Cuantitativa Escala - 100%
(%)
Índice UV Cuantitativa Escala - 13
Índice UV (por cate- Cualitativa, Ordinal
gorías de exposi- Discreta
ción)


http://www.ideam.gov.co/web/tiempo-y-
clima/indice-ultravioleta-iuv-
Presión atmosférica Cuantitativa Escala - 1029 hPa
por ciudades (hecto- (Quito)
pascales: hPa)
Temperatura (°C) a Cuantitativa Escala - Prom. 7°C
las 06:00
Velocidad del viento Cuantitativa Escala - 4 km/h
(k/h) a las 06:00
Precipitacion (mm) Cuantitativa Escala - 0.7 mm
Nubosidad Cuantitativa Escala - 89%
Llueve Cualitativa Nominal  Si Si
 No
¿Con qué sistemas
  Cualitativa Nominal □ QASIG Otros
georreferénciales □ GRASS
está familiarizado? □ uDIG
□ gvSIG
□ Otros
¿Cómo evaluaría el Cuantita- Ordinal No satisface mis expectativas Satisfacto-
desempeño de tiva-conti- Satisfactorio rio
QASIG? nua Superó mis expectativas

24
22 abril 2020
El tiempo en Quito para hoy es de 7ºC de temperatura mínima y 19ºC de máxima con un 76% de
nubes y una probabilidad de lluvia del 86%.
La sensación térmica en Quito podrá variar entre los diferentes momentos del día con 10ºC a las
07.00 h o los 12ºC de las 19.00 h.
La velocidad del viento será de 4 km/h soplando de dirección noreste.
http://tiempoytemperatura.es/ecuador/quito.html#por-horas

1.9.3. Ejemplos de otras variables

Variable Tipo N. med Codificación Ejemplo


Potencia de un microondas Cuantitativa Escala - 800 wats
(wats)
Tiempo (seg) para pasar de 0 a Cuantitativa Escala - 14 seg
10km/h
Volumen (m3) Cuantitativa Escala - 8 m3
Tamaño del gen (Mb) de org- Cuantitativa Escala - 400 Mb (pez globo) **
nismos y especies
Tipos de especies Cualitativa Ordinal Unicelular Pluricelular
Pluricelular
Dominios en el árbol de la vida Cualitativa Nominal Bacteria Eucarya
Archea
Eucarya
Intensidad de corriente (A) Cuantitativa Escala - 80 amp
Cantidad de sustancia (mol Cuantitativa Escala - 30 mol
Fuerza de tracción (kg m s‐2) Cuantitativa Escala -
Densidad del papel (g/m3) Cuantitativa Escala -
Resistencia a la ruptura del Cuantitativa Escala -
papl (kg/cm)
Ingresos mensuales ($) Cuantitativa Escala - 750 $
Número días de la semana, en Discreta Ordinal - 4
los que ha llovido
Número de defectos en un pro- Discreta Ordinal - 3 (peso, longitud, diáme-
ducto tro)

**: https://metode.es/revistas-metode/monograficos/el-tamano-del-genoma-y-la-comple-
jidad-de-los-seres-vivos.html

25
1.9.4. Tabla de frecuencias, del tipo de uniforme usado para ir a clase en día lunes (la regla
dice usar color verde). Este caso los valores de la variable y sus frecuencias absolutas
se representan directamente en la tabla para luego hallar las frecuencias relativas.

Uniforme ni fi
Verde 19 19/ 23 = 0.82
Blanco 1 0.04
Gris 1 0.04
Otros 2 0.08
total 23 1.00

El 82% cumple con la disposición, usando el uniforme reglamentario


El 17% no cumple con la disposición

1.9.5. Tabla de frecuencias, de la frecuencia cardíaca en reposo de estudiantes de la CAFDE

Xi 60 72 66 48 40 74 68 50 56 80 62 Total
ni 13 3 4 1 1 8 4 6 3 2 12 57

Se hará una distribución en clases con límites enteros, puesto que esta variable solo toma
este tipo de valores.
Paso 1: n= 57  k= 1+3.322*log(57) = 6,88 = 7
Paso 2: Rango = 80–40 =40 L = Rango/k = 40/7 = 5,7;
pero por conveniencia se toma L=6
Verificar Rango =L*k = 6*7 = 42, exceso = 2
Paso 3: li = 40-1 = 39 ls = 80+1 = 81
Paso 4: Construcción de la table:
Li Ls ni %
39 45 1 1,8%
45 51 7 12,3%
51 57 3 5,3%
57 63 25 43,9%
63 69 8 14,0%
69 75 11 19,3%
75 81 2 3,5%
57 100,0%

26
El 43.9% de los estudiantes tienen una frecuencia cardíaca mayor a 57 y menor o igual a 63.
Mientras que, el 1.8% tienen una frencuencia cardiaca inferior a 45, (posiblemente deportistas
élite, no es una afirmación). Y solo el 3.5% de los estudiantes tendrían una frecuencia cardiac
superior a 75 (posiblemente esdudiantes con estrés en clase, situación que se debería consultar).

1.9.6. Realice un análisis comparativo entre el tiempo que se demorarán en ducharse los estu-
diantes hombres y las estudiantes mujeres.
X: Tiempo en la ducha
M H
10 15
20 13
15 8
15 9
10
11
12
9
10
n1= 4 n2=9

Mujeres Hombres (completar)


Medidas de tendencia central:
𝑥̅1 =10+20+15*2/4=15 min
Me1=x2+x3/2=15
Mo1= 15

Medidas de dispersion
s1²=[(10–15)²+(20–15)²+(15–15)²*2]/3=
16.57
s = 4.08 min
Cv1= (4.08/15)*100= 27.2% moderada
Rango 1 = 20 - 10 = 10 [min]

1.9.7. Realice un análisis comparativo entre los pesos (kg) de estudiantes hombres en dos
estratos por edades, según los datos de la tabla.
Estrato 1= estudiantes con el menor o igual que 22 años
Estatus 2= estudiantes con edades mayores a 22 años
X: peso (Kg)

27
Estrato 1 Estrato 2
70 59
64,4 49
56,6 59
68 74
57,4 68
63 72
67,5 61
78
58
66
74
67
65
72
n1= 14 n2= 7

Resumen de medidas descriptivas por grupos de edad

Estrato 1: Hombres de hasta 22 años Estrato 2: Hombres mayores de 22 años


n=15 n=7
Medidas de tendencia central: Medidas de tendencia central:
𝑥̅1 =66,20Kg 𝑥̅2 =66,71Kg
Me1= X7+X8/2=66+67/2=66.5 Me1=X(n+1)/2 = X8/2 = X4 =68
Mo1= no existe Mo1= {59;74} “Distribución Binomial

Medidas de dispersión Medidas de dispersión


Rango 1 = Máx.–mín. = 78-56,6 = 21,4Kg Rango 2=Máx.–Min=74-59 =15Kg
s1²= 38,81 s1²= 47,89 Kg
s = 6,23 s = 6,92 Kg
Cv1=6,23/66,20 9% Variación baja Cv1=6,92/66,71  10% Variación baja

Medidas de posición Medidas de posición


P(25%) = X(n+1)p = X15* 0,25 = X4 = 63Kg P(25%) = X(n+1)p= X8*0,25 =X2 =59Kg
P50%= x15*0.50=x66.5 P50%= x8*0.50=x68
P(75%) = X(n+1)p = X15* 0,75 = X11= 70Kg P(75%) = X(n+1)p= X8* 0,75= X6=75Kg

Medidas de forma α³=218.197*14/(6.23³ /10*13)=0.0810


α3=((59-66.71)³*2(61- α4=43572.2739/6.23̂ 4*14.15/13/12/11=-
66.71)³+……….*7/6*5=-0.1259 0.3013

28
Tabla de cálculos para hallar las medidas de forma.
Pesos xi- x (xi-x)³ni (xi-x)4ni
56.6 -9.6 - 88 4.736 84 93. 4659
57.4 - 8.8 - 68 1.47 2 5996. 9536
58.0 - 8.2 -55 1.36 8 45 21.1176
63.0 - 3.2 -32.7 68 164. 8576
64.0 - 1.8 - 5.83 2 10.49 66
65.0 - 1.2 - 1.72 8 2.0 736
66.0 - 0.2 - 0.008 0.00 16
67.0 0.8 0.51 2 0.40 96
67.3 1.3 2.197 2.85 61
68 1.8 3.832 10.49 66
70 3.8 54.8072 208.5136
72 5.8 195.112 1131.64 96
74 7.8 47.552 3700.50 52
78 11.8 16 43.0 32 1938 7.770
Total 218.197 4357 2.27 39

Resumen de resultados
Estrato 1 Estrato 2
X 66.20 66.73
Me 66.5 68
Mo No existe {59.74}
Rango 21.4 15
S 6.23kg 6.92kg
s² 38.81 47.89
CV 9% 10%
P25% 63kg 59%
α³ 0.081 -0.1259
α4 -0.3013 1.4820

Interpretación

Prácticamente los estudiantes con edades hasta de 22 años tienen pesos que presentan sesgo
ligeramente hacia la derecha mientras que el grupo de estudiantes mayores de 22 años tienen un
ligero sesgo hacia la izquierda. Para el primer estrato, la distribución es platicúrtica, mientras que
para el Segundo grupo es leptocurtica.

29
1.9.8. Realice un análisis descriptivo de la variable “distancia recorrida (metros) en el test de
Cooper” aplicada a una muestra de 23 estudiantes de la PADFE. Usar Excel.
Nombre distancia frecuencia cardíaca máxima edad civil o militar
Francisco 2960 193 32 * militar
Bryan 2500 180 22 civil
Stalin 2450 181 19 civil
Ariel 2600 185 19 civil
Richard 2525 170 20 civil
Daniel 2900 188 21 civil
Edith 3015 185 29 * militar
Andrés 2300 170 20 civil
Michael 2250 81 21 civil
Paulo 2500 181 20 civil
Cristopher 2573 201 19 civil
Leonardo 2410 196 19 civil
Jairo 2600 161 29 * Militar
Ismael 2600 185 20 civil
Cristian 2500 170 20 civil
Sebastián 2395 180 21 civil
Jordi 2650 204 31* Militar
Marlon 2300 196 21 civil
Jorge 2615 191 22 civil
Raúl 2410 199 22 civil
Jimmy 2850 193 23 civil
Pamela 2200 192 21 civil
Diana 2300 215 19 civil

Proceso en Excel: Seleccionar DATOS / Análisis de datos /Estadística Descriptiva

Resumen de medidas descriptivas de la Distancia recorrida Test de Cooper (m)

Media 2539,2609 Interpretación


Error típico 46,5781
Mediana 2500 La distribución presenta sesgo,
Moda 2500 sin embargo, media y mediana
Desviación estándar 223,3807
son similares. Se observa un
Varianza de la muestra 49898,9289
Curtosis -0,0937 rango de variación de edades con-
Coeficiente de asimetría 0,6657 siderable, por lo que se reco-
Rango 815 mienda obtener los resultados
Mínimo 2200 por edades para comprender me-
Máximo 3015
jor los rendimientos obtenidos.
Suma 58403
Cuenta 23 Aunque en términos generales
Calculados con fórmula pareciera que la edad no influye
Coeficiente de variación 0,0880 medidas de dispersión.
Percentil 5% 2255
Percentil 95% 2954
Curtosis -0,0937

30
1.10. Ejercicios propuestos
1.1. ¿Cuál es la diferencia entre población y muestra?
1.2. Explique la diferencia entre variables cualitativas y cuantitativas
1.3. Explique la diferencia entre variables discretas y continuas
1.4. En las siguientes variables identifique, su tipo y el nivel de medida
Variable Tipo Nivel de medida
a. Número de grietas superficiales Discreta Razón
b. Estado civil ________________ ________________
c. Peso [Kg] ________________ ________________
d. Ingresos mensuales ($) ________________ ________________
e. Número de mascotas en casa ________________ ________________
f. Distancia para llegar a casa. ________________ ________________
g. Nivel en la carrera ________________ ________________
h. Temperatura (°C) ________________ ________________
i. Resistencia () ________________ ________________
j. Velocidad (km/h) ________________ ________________

1.5. Identifique el tipo de pregunta: abierta, cerrada o mixta.


Pregunta Tipo Codificación – Respuesta
a. ¿Realiza actividad física durante __________ 1. Si  2. No 
la cuarentena?
b. ¿Por qué escogió PAFDE? __________ ...........................................
c. ¿Cuál es su género? __________ 1. Femenino  2. Masculino 
d. ¿Está de acuerdo con quedarse en __________ 1. Si  2. No 
casa durante la pandemia? ¿Por qué?.......................................
e. Número de chips defectuosos __________ ........
f. ¿Cuál es el ingreso de sus padres? __________ $........
g. ¿Cuál es el nivel de estrés que ha __________ 1. Bajo  2. Medio  3. Alto 
sentido durante la cuarentena?
h. ¿Qué medidas de aseo ha tomado __________ 1. Gel en manos  2. Alcohol al in-
durante la cuarentena? gresar a casa  3. Lavado de ma-
nos 4. Otros 

1.6. Identifique el tipo de pregunta y si es posible codifique las respuestas.


a. Número de circuitos defectuosos en una muestra de tamaño 23,
b. Rango militar,
c. Contextura Física,

31
d. Sexo,
e. Nivel de Educación
1.7. Diseñe una ficha de observación sobre algunas características de automóviles.
1.8. Diseñe una ficha de observación sobre algunas características en una competencia de
100 metros velocidad natación.
1.9. ¿Cuál es la diferencia entre frecuencia absoluta y frecuencia relativa?
1.10. ¿Qué es una marca de clase?
1.11. ¿Puede ser el número de clases un número decimal?
1.12. Si el tamaño de la muestra es 60, ¿cuántas clases recomendaría?
1.13. ¿Qué tipo de gráficos se utilizan para las variables cualitativas y discretas?, ¿Por qué?
1.14. ¿Cuál es la diferencia entre un histograma y un gráfico de barras?
1.15. Consulte sobre datos de población por sexo y realice un pictograma
1.16. Consulte sobre datos de población por género y realice un pictograma
1.17. Complete y analice la variable X= Número de Alumnos de la ESPE

Asignatura Número de alumnos (ni) Fi Ni Fi %


CCAA 1200
GEOGRÁFICA 80
SISTEMAS 1050
TOTAL: 2330

1.18. Complete y analice la variable X= Número de hijos por familia


Número de hijos ni fi Ni Fi %
0 2
1 4
2 7
3 10
4 6
5 o más 4
TOTAL: 100

1.19. Los siguientes datos corresponden a los salarios (en dólares) de un grupo de ejecutivos
de nivel medio en:
185 196 257 274 282 299 273 186 281 221
232 299 322 201 230 242 197 252 258 323
187 275 289 198 225 234 253 268 314 323
a. ¿Qué porcentaje de ejecutivos tienen salarios de al menos 290 dólares?
b. Realice el diagrama de Tallo y Hojas
c. Realice la distribución de frecuencias en clases, el histograma de frecuencias.

32
1.20. Los siguientes datos representan las observaciones referentes a colegiaturas (en $000)
para residentes fuera del estado en 60 colegios y universidades de Texas.
7.2 4.9 10.7 6.4 4.8 4.7 4.6 6.0 5.4 10.4
4.8 4.7 8.3 4.8 8.3 6.4 6.6 4.5 8.0 3.8
3.6 2.4 8.5 7.7 4.9 8.6 12.0 4.9 7.0 8.8
11.0 4.9 3.9 4.4 4.9 4.9 8.0 3.6 7.4 4.9
7.9 4.9 5.8 11.6 10.3 3.4 3.9 5.0 3.9 3.9
8.0 3.5 4.9 4.1 3.9 3.5 4.8 5.9 3.6 5.8
Tomado del American’s Best College 1994 College Fuide”. U.S. News & World Report

Realice:
a. Diagrama de tallo y hojas
b. Diagrama de cajas
b. Tabla de distribución de frecuencias
c. Histograma de frecuencias
d. Resumen de todas las medidas descriptivas.
e. Repita el ejercicio, usando Excel
f. Repita el ejercicio, usando PSPP

1.21. Ejercicio 42, capítulo 2 del texto “Estadística para Administración y Economía”, Ma-
son/Lind/Marchal. Supuestamente un cereal para desayuno incluye 200 pasas en
cada caja. Una muestra de 60 cajas, el día de ayer, mostró el siguiente número de
pasas en cada caja. (Ejercicio 42, Cap. 2 “Estadística para Administración y Econo-
mía”, Mason/Lind/Marchal). Analice los datos de las videocámaras a través de una
distribución de frecuencias.

191 195 196 198 198 199 200 200 200 201 202 203 204 205 206
193 195 197 198 199 199 200 200 201 202 202 203 204 205 206
193 196 197 198 199 200 200 200 201 202 202 204 205 206 206
193 196 197 198 199 200 200 200 201 202 203 204 205 206 207

1.22. Ejercicio. Prob. Y Estadistica aplicada a la Ing., Douglas Montgromery, George Run-
gerCap.1, Ejerc. 1.7. Un artículo publicado en Tecnnometrics (Vol. 19, 1977, pág. 425)
presenta los datos siguientes sobre el octanaje de varias mezclas de gasolina.

83,4 87,7 88,5 89,3 89,9 90,5 91,1 91,8 92,7 94,2
84,3 87,8 88,6 89,6 90,0 90,6 91,1 92,2 92,7 94,4
84,3 87,9 88,7 89,7 90,1 90,7 91,2 92,2 93,0 94,7
86,7 88,2 88,9 89,8 90,1 90,8 91,2 92,3 93,2 96,1
86,7 88,3 88,9 89,8 90,3 90,9 91,5 92,3 93,3 96,5
86,7 88,3 89,0 89,8 90,4 91,0 91,5 92,6 93,3 98,8

33
87,4 88,3 89,2 89,9 90,4 91,0 91,6 92,7 93,4 98,8
87,5 88,4 89,2 89,9 90,4 91,0 91,6 92,7 93,7 100,3
87,6 88,5

Realice lo siguiente:
a. Diagrama de tallo y hojas
b. Diagrama de caja
c. Tabla de distribución de frecuencias
d. Histograma de frecuencias
e. Resumen de todas las medidas descriptivas
f. Repita el ejercicio, usando Excel
g. Repita el ejercicio, usando R-Studio

1.23. Con los datos de la Resistencia de 100 bobinas (Ohmios


32,7 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,8
32,8 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,9
32,9 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,9
32,9 33,1 33,2 33,3 33,4 33,5 33,5 33,6 33,7 33,9
32,9 33,1 33,2 33,3 33,4 33,5 33,6 33,6 33,7 33,9
33,0 33,1 33,2 33,3 33,4 33,5 33,6 33,6 33,8 34,0
33,0 33,1 33,2 33,3 33,4 33,5 33,6 33,6 33,8 34,0
33,0 33,1 33,2 33,3 33,4 33,5 33,6 33,7 33,8 34,1
33,0 33,1 33,3 33,4 33,4 33,5 33,6 33,7 33,8 34,1
33,0 33,2 33,3 33,4 33,4 33,5 33,6 33,7 33,8 34,4

Realice lo siguiente:
a. Diagrama de tallo y hojas
b. Diagrama de caja
c. Tabla de distribución de frecuencias
d. Histograma de frecuencias
e. Resumen de todas las medidas descriptivas
f. Repita el ejercicio, usando Excel
h. Repita el ejercicio, usando R-Studio

1.24. Con los datos de los pesos en libras usado en el ejemplo de pesos de personas sometidas
a pruebas físicas:
a. Agrupe estos pesos en las siguientes categorías: Delgado: ≤ 135 libras, Normal: ]135,
160], obeso 1: ]160, 185], obeso 2: >185 libras.
b. Con esta clasificación elabore una tabla de frecuencias y un gráfico de barras.
1.25. Realice una encuesta sobre un tema de interés relacionado con su ámbito de estudios
con 10 preguntas. Aplique la encuesta con formulario google docs. Realice el informe.

34
1.11. Deber
Realice los siguientes ejercicios propuestos:
- Ejercicios 1.1 al 1.5 (papel, esferos, calculdora)
- Ejercicios 1.17, 1.18 (Excel)
- Ejercicio 1.21 ((papel, esferos, calculdora, pero en los literales de media, desviación es-
tándar, coeficiente de asimetría, curtosis, tabla de frecuencia, hacerlo en Excel)
- Ejercicio 1.22 (Excel)
- Ejercicio 1.23 (En la interfaz R-Studio para R)

Bibliografía

Muestreo no probabilístico: Muestreo por conveniencia. Recuperado el 16 de marzo de 2020


dehttps://www.netquest.com/blog/es/blog/es/muestreo-por-conveniencia

¿Qué es una encuesta? Recuperado el 16 de marzo de 2020 de https://www.question-


pro.com/es/una-encuesta.html

Ejemplos de escalas de Likert. Recuperado el 16 de marzo de 2020 de https://www.question-


pro.com/blog/es/ejemplos-de-escalas-likert/

Scheaffer, R., y Mendenhall, W. (2012). Elementary Survey Sampling. Seventh Edition. (pp.
7-15, pp. 217-220). University of Florida: Emeritu.

Montgomery, D., y Runger, W. (2012). Elementary Survey Sampling. Seventh Edition. (pp. 7-
15, pp. 217-220). University of Florida: Emeritu.

Scheaffer, R., y Mendenhall, W. (2012). Elementary Survey Sampling. Seventh Edition. (pp.
7-15, pp. 217-220). University of Florida: Emeritu.

Montogomery D., y Runger G., (2003). Probabilidades y Estadistica aplicadas a la Ingenieria.


Segunda Edición. Imusa.

Lind D., Marchal W., Wathen S., (2012). Estadística Aplicada A Los Negocios y La Econo-
mía. Décimo quinta Edición. McGraw-Hill/Interamericana Editores.

35

También podría gustarte