INVESTIGACIÓN ESTADÍSTICA COMPUTACIONAL
PRIMERA PARTE: INVESTIGACIÓN (PUNTAJE TOTAL 30 PUNTOS)
TEMA Nº 1: INTRODUCCIÓN
1.1 Investigue 3 conceptos de Estadística. (Menciona autor)
• La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos
de masa o colectivo, cuya mediación requiere una masa de observaciones de otros
fenómenos más simples llamados individuales o particulares". (Gini, 1953).
• La estadística es la ciencia que trata de la recolección, clasificación y presentación de los
hechos sujetos a una apreciación numérica como base a la explicación, descripción y
comparación de los fenómenos". (Yale y Kendal, 1954).
• Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la
estadística como un valor resumido, calculado, como base en una muestra de
observaciones que generalmente, aunque no por necesidad, se considera como una
estimación de parámetro de determinada población; es decir, una función de valores de
muestra.
TEMA Nº 2: HOJA DE VERIFICACIÓN Investigue: según Sampieri
https://www.smujerescoahuila.gob.mx/wp-content/uploads/2020/05/Sampieri.Met.Inv.pdf
2.1 ¿Cómo se lleva a cabo el procedimiento de selección de la muestra?
R.- Primero se debe definir la unidad de análisis (esto se entiendo como personas,
organizaciones, etc.) en pocas palabras se refiere “a quienes van a ser medidos”, también
se debe precisar el problema a investigar, así como los objetivos de la investigación, lo cual
llevara a delimitar la población que será estudiada y sobre la cual se pretenda generalizar los
resultados obtenidos.
2.2 Defina y realice un ejemplo de cómo se construye una escala Likert
R.- La escala de likert es un método de investigación que utiliza una escala de calificación
para conocer el nivel de acuerdo y desacuerdo de las personas sobre un tema. Creada en
1932 por el psicólogo americano Rensis Likert, la escala pretende no limitar las respuestas
a “sí” o “no”
EJEMPLO:
Señor cliente ¿qué tan satisfecho/a o insatisfecho/a te sientes con respecto a los
servicios de nuestra empresa?:
➢ Muy satisfecho/a
➢ Algo satisfecho/a
➢ Ni satisfecho/a ni insatisfecho/a
➢ Algo insatisfecho
➢ Muy insatisfecho
TEMA Nº 3: HISTOGRAMA
3.1 Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de azufre de
una planta industrial.
a) Construya una distribución de frecuencias para estos datos. (usando la fórmula de Sturger)
b) Dibuje el histograma y el polígono de frecuencias.
12.3 15.8 18.5 21.9 24.6 29.5 33 35.1
13.4 16.2 19.1 22.3 25.1 30.6 33.2 36.8
13.6 17.3 19.6 22.4 26.4 31.7 33.9 37.5
14.9 17.9 20.1 22.7 26.8 32.3 34.2 38.3
15.1 18 20.5 23 27.5 32.5 34.6 38.5
15.5 18.4 21.3 23.9 28.3 32.9 34.9 38.7
CLASE fri = fi/N Frec fri = fi/N*100 Fri =
Media de fi frec Abs Fi Frec Abs
Nº Relativa Frec Relativa Relativa
Linf Lsup Clases simple Acuml
Simple Simple ACUM
1 6.9 11.5 9.2 5 5 0.09 9.26 9.26
2 11.5 16.1 13.8 8 13 0.15 14.81 24.07
3 16.1 20.7 18.4 10 23 0.19 18.52 42.59
4 20.7 25.3 23 9 32 0.17 16.67 59.26
5 25.3 29.9 27.6 5 37 0.09 9.26 68.52
6 29.9 34.5 32.2 9 46 0.17 16.67 85.19
7 34.5 39.1 36.8 8 54 0.15 14.81 100.00
N 54 1.00 100.00
N 54 CANTIDAD DE DATOS
X MAX 6.9 MENOR DATO
X MIN 38.7 MAYOR DATO
Rango 31.8 =32 RANGO
K 6.71689941 FORMULA DE STURGER
K NUMERO DE CLASES
7
REDONDEADO ADOPTADO
C = Amplitud
de Clase ANCHO DE CLASE
C = Amplitud
de Clase 4.54285714
C= 4.6
3.2 Supongamos que en una encuesta se han obtenido los siguientes datos sobre las
horas extraordinarias anuales realizadas por trabajadores de una determinada
empresa: (usando la fórmula de Sturger)
24 32 49 52 58 66 72 78
28 36 50 53 59 67 73 80
28 38 50 54 60 67 74 82
30 40 51 54 62 68 75 85
31 46 52 55 63 69 77 88
32 47 52 57 64 70 77 94
a) Construya una distribución de frecuencias para estos datos.
b) Dibuje el histograma y el polígono de frecuencias.
CLASE Media de fi frec Abs Fi Frec Abs fri = fi/N fri = fi/N*100 Fri = Relativa
N° Linf Lsup Clases simple Acuml Frec Frec Relativa ACUM
1 24 34 29 7 7 0.146 14.58 14.58
2 34 44 39 3 10 0.063 6.25 20.83
3 44 54 49 10 20 0.208 20.83 41.67
4 54 64 59 9 29 0.188 18.75 60.42
5 64 74 69 9 38 0.188 18.75 79.17
6 74 84 79 7 45 0.146 14.58 93.75
7 84 94 89 3 48 0.063 6.25 100.00
N 48 1 100
N 48 CANTIDAD DE DATOS
X MAX 24 MENOR DATO
X MIN 94 MAYOR DATO
Rango 70 RANGO
K 6.5480 FORMULA DE STURGER
K REDONDEADO 7 NUMERO DE CLASES ADOPTADO
C = Amplitud de Clase ANCHO DE CLASE
C = Amplitud de Clase 10
C= 10
TEMA Nº 4 : MEDIDA DE TENDENCIA CENTRAL Y DISPERSIÓN
4.1 De los siguientes datos calcule media aritmética, mediana, la moda, la varianza y la
desviación típica
MEDIA
ARITMETICA 9.5
MODA #N/D no existe
MEDIANA 8.5
4.2 Observa el siguiente diagrama de barras y forma la tabla de frecuencias absolutas.
calcule media aritmética, mediana, la moda, la varianza y la desviación típica
8
7
6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9 10
3 En la siguiente tabla se muestran los resultados de una encuesta entre 100
personas, sobre sus preferencias por espectáculos:
Tipo Nº de
personas
Cine 41
Teatro 8
Música 12
Variedades 19
a)Forma la tabla estadística de las frecuencias absolutas y relativas.
fi fri = fi/N fri % Fri Frec
FI Frec abs
x (datos) (Frecuencia Frecuencia Frecuencia Relativa
acumulada
absoluta) relativa relativa Acum
cine 41 41 0.41 41 0.41
teatro 8 49 0.08 8 0.08
musica 12 61 0.12 12 0.12
variedades 19 80 0.19 19 0.19
otros 20 100 0.2 20 0.2
TOTAL N = 100
b) Representa los datos en un diagrama de sectores, diagrama de barras y polígono
de frecuencias.
c) Determine la Moda.
cine 41
teatro 8
musica 12
variedades 19
otros 20
Mo =41personas de 100 prefieren el cine
4 Observa el siguiente diagrama de barras y forma una tabla de frecuencias absolutas.
Unidades
vendidas
300 260
200 160
120 110
80
100 50
0
Azucar Verduras Pan Leche Pescado Carne
a)Forma la tabla estadística de las frecuencias absolutas y relativas.
fi fri = fi/N fri % Fri Frec
FI Frec abs
x (datos) (Frecuencia Frecuencia Frecuencia Relativa
acumulada
absoluta) relativa relativa Acum
AZUCAR 50 50 0.06 6.41 0.06
VERDURAS 120 170 0.15 15.38 0.15
PAN 260 430 0.33 33.33 0.33
LECHE 160 590 0.21 20.51 0.21
PESCADO 110 700 0.14 14.10 0.14
CARNE 80 780 0.10 10.26 0.10
TOTAL N = 780
b) Representa los datos en un diagrama de sectores y polígono de frecuencias.
c) Determine la Moda.
Mo= 260 el producto mas vendido es el Pan
TEMA Nº 5 : ESTRATIFICACIÓN
Digamos que a 100 (Nh) estudiantes de una escuela de 1000 (N) estudiantes se les hacen
preguntas sobre su materia favorita. Es un hecho que estudiantes de primer grado tendrán
diferentes preferencias que los estudiantes de quinto grado.
Para que la encuesta arroje resultados precisos, la manera ideal es dividir cada grado en
varios estratos.
Aquí hay una tabla del número de estudiantes en cada grado:
Grado Número de estudiantes
5 150
6 250
7 300
8 200
9 100
Calcula la muestra de cada grado utilizando la fórmula de muestreo estratificado:
n1….x=N1/N*n
n1 = 100/1000 * 150 = 15
n2 = 100/1000 * 250 = 25
n3= 100/1000 * 300 = 30
n4= 100/1000 * 200 = 20
n5= 100/1000 * 100 = 10
TIPO CUANTITATIVO TIPO CUALITATIVO
n=1000*(2.58)*0.1*0.9
999*(2.58)*0.1*0.9
n=56
estudiantes de primer grado tienen preferencia con los de quinto grado
% Valor d
90 0,1
95 0,05
99 0,01
TEMA Nº 6 : DIAGRAMA DE DISPERSIÓN
Análisis de Regresión Lineal
6.1. La siguiente tabla muestra la relación que hay entre la temperatura promedio
mensual (T) en ºC de una ciudad en particular, y la venta de helado mensual en miles
de dólares (D).
a) Encontrar la recta de regresión de las ventas mensuales respecto a la temperatura
promedio de cada mes.
b) Calcular el coeficiente de correlación lineal e interpreta el resultado.
c) A partir de la recta de regresión, ¿cuántos miles de dólares se venderían en un
mes con una temperatura promedio de 12º C?
MES TEMPERATURA VENTAS
ENERO 3 15
FEBRERO 4 18
MARZO 8 25
ABRIL 15 40
MAYO 20 55
JUNIO 24 80
JULIO 28 90
AGOSTO 27 85
SEPTIEMBRE 23 70
OCTUBRE 15 45
NOVIEMBRE 9 30
DICIEMBRE 4 20
TOTAL 180 573
Y=2.9266X+3.8506 ECUACION DE REGRESION LINEAL
R2=0.9741 COHEFICIENTE DE CORRELACION
TEMA Nº 7: DIAGRAMA DE PARETO
La Empresa Comercial P&T que se dedica a la venta de diferentes marcas de harina requiere
determinar cuáles de las marcas de harinas son las más vendidas y preferidas por los
clientes. A continuación, presentamos las ventas por cada una:
APLICACIÓN DEL DIAGRAMA DE PARETO
P. P.
MARCA DE HARINAS Frecuencia Linea 80 fri
Acumulado Acumulado
Esfera azul 72,858.00 45.40% 80% 0.454 45%
Hercules 34,716.00 21.60% 80% 0.216 67%
El rey 22,085.00 13.70% 80% 0.137 81%
Luna de oro 17,131.00 10.70% 80% 0.107 91%
La niña 8,370.00 5.20% 80% 0.052 97%
El Yaqui 4,511.00 2.80% 80% 0.028 99%
Abuela Josefa 980 0.60% 80% 0.006 100%
160,651.00
Con este resultado se puede concluir que la mejor decisión es permanecer con las marcas
Esfera Azul, Hércules y El Rey, ya que representan poco más del 80% de las ventas,
mientras que las otras representan menos del 20% del total de las ventas.
SEGUNDA PARTE
SEGUNDO PARTE: INVESTIGACIÓN (PUNTAJE TOTAL 10 PUNTOS)
Tema 1: Introducción a la Estadística
1. ¿Cuál es la definición de Estadística?
a) Ciencia que trata de la recolección, organización, análisis y descripción numérica de la información.
b) Ciencia que estudia el comportamiento de los fenómenos individuales.
c) Ciencia que se ocupa únicamente de la recolección de datos.
2. ¿Qué estudia la Estadística Descriptiva?
a) Realiza inferencias sobre una población basándose en una muestra.
b) Organiza, resume y presenta datos destacando aspectos característicos sin llegar a conclusiones generales.
c) Se ocupa únicamente del análisis matemático de los datos.
3. ¿Qué hace la Estadística Inferencial?
a) Organiza datos en tablas y gráficos.
b) Realiza inferencias y deducciones sobre una población basándose en una muestra.
c) Describe únicamente datos cualitativos.
4. ¿Qué es una población en estadística?
a) Un conjunto finito de objetos.
b) Un conjunto de datos numéricos.
c) Un conjunto finito o infinito de personas u objetos con características comunes.
5. ¿Qué es una muestra en estadística?
a) La suma total de todos los datos.
b) Parte representativa y adecuada de la población que refleja las semejanzas y diferencias encontradas en ella.
c) Un grupo de datos cualitativos.
6. ¿Qué es una variable cualitativa nominal?
a) Una variable que sólo toma valores enteros.
b) Una variable con categorías que se pueden ordenar.
c) Una variable con categorías sin orden.
7. ¿Qué es una variable cuantitativa continua?
a) Una variable que toma valores enteros.
b) Una variable que puede tomar cualquier valor real dentro de un intervalo.
c) Una variable con categorías que se pueden ordenar.
8. ¿Cuál es una de las formas básicas de presentación de datos?
a) Recolección de datos.
b) Clasificación de datos.
c) Análisis de datos.
9. ¿Qué es una hoja de verificación?
a) Una herramienta para graficar datos.
b) Una herramienta para recolectar datos basada en la observación de un proceso.
c) Un método para calcular promedios.
10. ¿Qué representa un histograma?
a) La relación entre dos variables.
b) La distribución de la frecuencia de una variable continua basada en intervalos de clase.
c) Una lista de verificación de datos.
11. ¿Cuál es una medida de tendencia central?
a) Desviación estándar.
b) Varianza.
c) Media aritmética.
12. ¿Cuál es una medida de dispersión?
a) Mediana.
b) Moda.
c) Varianza.
13. ¿Qué es un muestreo estratificado?
a) Dividir la población en estratos homogéneos respecto a las características a estudiar.
b) Seleccionar una muestra al azar de toda la población.
c) Usar solo datos cualitativos en la muestra.
14. ¿Qué muestra un diagrama de dispersión?
a) La distribución de frecuencias.
b) La relación entre dos clases de datos.
c) Un resumen de datos cualitativos.
15. ¿Qué prioriza un diagrama de Pareto?
a) La relación entre dos variables.
b) Problemas o causas según su importancia.
c) La recolección de datos cualitativos.
16. Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 65
kilos y el de los hombres de 85. ¿Cuál es el peso medio de las 10 personas del ascensor?
17. De las edades de cuatro personas, se sabe que la media es igual a 28 años, la mediana es 24 años y la moda
es 22 Encuentre las edades de cuatro personas. (ejercicio para desarrollar)