ESTADISTICA
NOCIONES DE ESTADISTICA Y DISTRIBUCION DE FRECUENCIAS PARA
DATOS NO AGRUPADOS Y AGRUPADOS
TALLER 1
1. Qu es la estadstica?
Segn PUENTE DE VIEDMA (2009) se entiende por Estadstica: la disciplina
cientfica que trata de la recoleccin, anlisis, y presentacin de datos (pg. 42).
GARRIGA et al (2009) considera que la estadstica: se ocupa de la
sistematizacin, recogida, ordenacin y presentacin de los datos referentes a un
fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con
objeto de hacer previsiones sobre los mismos, tomar decisiones u obtener
conclusiones (pg. 20)
.
2. Cules son las ramas de la estadstica?
La Estadstica se divide en Estadstica Descriptiva y Estadstica Inferencial.
MENDENHALL et al (2010) las define as:
La estadstica descriptiva est formada por procedimientos empleados
para resumir y describir las caractersticas importantes de un conjunto de
mediciones.
La estadstica inferencial est formada por procedimientos empleados
para hacer inferencias acerca de caractersticas poblacionales, a partir de
informacin contenida en una muestra sacada de esta poblacin. (pg. 4).
3. Cules son las etapas de la estadstica?
La investigacin estadstica tiene las siguientes etapas:
A. Recoleccin de informacin: En esta etapa se recoge la informacin
cualitativa y cuantitativa sealada en el diseo de la investigacin. Incluye
tareas como:
a. Eleccin de la muestra.
b. Determinacin del tipo de encuesta.
c. Diseo del cuestionario.
d. Conduccin del experimento.
B. Organizacin de la informacin: En esta etapa del mtodo estadistico la
informacin recogida es sometida a revisin, clasificacin y calculo
numrico.
C. Presentacin de la Informacin: En esta etapa del mtodo estadstico se
elaboran los cuadros y los grficos que permiten una inspeccin precisa y
rpida de los datos. La elaboracin de cuadros y tablas tiene como
propsito acomodar los datos de manera que se pueda efectuar una
revisin numrica precisa de los mismos. La elaboracin de grficos tiene
por propsito facilitar la inspeccin visual rpida de la informacin.
D. Sntesis: En esta etapa la informacin es resumida en forma de medidas
que permiten expresar de manera resumida las principales propiedades
numricas de grandes series o agrupamientos de datos. Estas medidas
tienen como propsito facilitar la comprensin global de las caractersticas
fundamentales de los agrupamientos de datos.
E. Anlisis e Interpretacin de los resultados: En esta etapa, mediante
frmulas y pruebas estadsticas apropiadas y el uso de tablas
especficamente diseadas, se efecta la comparacin de las medidas de
resumen previamente calculadas.
Qu es una variable y como se clasifica?
Entendemos por variable: es una caracterstica que cambia o vara con el tiempo
y/o para diferentes personas u objetos bajo consideracin MENDENHALL et al
(2010, pg. 8).
Las variables pueden ser:
Cuantitativas, cuando su valor se exprese numricamente, como la edad
de una persona, su estatura o su salario, o
Cualitativas, cuando su valor sea un atributo como el color de los ojos o el
municipio de nacimiento.
Las variables cuantitativas pueden a su vez clasificarse en:
Continuas o de intervalo, cuando pueden tomar cualquier valor real en un
intervalo, como la estatura de una persona o el peso de una mercanca, o
Discretas, cuando slo toman valores enteros, como el nmero de
hermanos o el nmero de veces que se ha ido a cine durante el mes.
Las variables cualitativas pueden clasificarse en :
Binarias, cuando toman nicamente dos valores posibles, como el gnero
(mujer, hombre) o
Generales, cuando toman muchos valores posibles, como el municipio de
residencia o el color de ojos. Si estas presentan algn tipo de orden se
llaman variables ordinales, ejemplo: Alto, medio, bajo.
4. Defina y d un ejemplo de cada uno:
4.1 Poblacin: es el conjunto total de entes (personas, animales o cosas)
sobre los que se va llevar a cabo la investigacin estadstica. El tamao
de la poblacin es el nmero de elementos que la componen. En un
estudio sobre el nivel educativo de los habitantes de Bogot la poblacin
es la poblacin total que vive en esta ciudad.
4.2 Muestra: es un subconjunto cualquiera de una poblacin. Por ejemplo si
en el estudio anterior se entrevistan 2500 personas, la muestra sern los
2500 entrevistados.
4.3 Dato: es una pieza de informacin. Es el valor especfico que toma una
variable. En el estudio del nivel educativo en Bogot, si un entrevistado
responde que su nivel educativo es PROFESIONAL, este ser el dato
recogido.
4.4 Frecuencia: es el nmero de casos o cantidad de veces que se repite un
valor para cierta variable. Por ejemplo, si 128 personas de los
entrevistados en el estudio responden que su nivel educativo es
bachiller, la frecuencia absoluta de BACHILLER ser 128 y la relativa
ser 128/2500.
5. En cierta empresa se desea hacer una clasificacin del personal de
acuerdo al cargo asignado, con el fin de estudiar una posible
reestructuracin en los salarios. La codificacin utilizada es la siguiente:
1. Gerente
2. Administrador
3. Jefe de personal
4. Secretaria
5. Archivista
6. Aseadora
7. Celador
La informacin obtenida una vez aplicada la codificacin al personal de la
empresa produce los siguientes datos:
1, 1, 2, 5, 4, 6, 7, 5, 3, 2, 2, 7, 6,7, 6, 5, 5, 4, 4, 4, 1, 1, 1, 2, 4, 4, 4, 6, 6, 7,
7, 4, 5, 2, 1, 4, 5, 6
La actividad a realizar consiste en resumir estos datos en la siguiente tabla
e interpretar algunos resultados:
CODIGOS fi hi Fi Hi
1 6 6/38 6 6/38
2 5 5/38 11 11/38
3 1 1/38 12 12/38
4 9 9/38 21 21/38
5 6 6/38 27 27/38
6 6 6/38 33 33/38
7 5 5/38 38 38/38
Total 38 38/38 38 38/38
Interpretacin de algunos resultados:
f3 = 1 solo una persona es de categora 3 (Jefe de personal).
h4=9/38 de los 38 entrevistados 9 son de la categora 4 (Secretaria)
F2= 11 tenemos 11 personas que son de la categora 1 (Gerente) o 2
(Administrador)
H3= 12/38 de los 38 entrevistados 12 son de las categoras 1 1 (Gerente)
2 (Administrador) 3 (Jefe de personal).
Se desea hacer un estudio sobre el servicio al usuario en la hemeroteca de
la universidad del Quindo, para ello se realiza una encuesta a 25 usuarios
de la biblioteca. (Por medio de un test donde se califica el servicio de uno
(1) a cinco (5)).
Los resultados obtenidos son los siguientes:
2 1 3 1 1
3 5 4 3 3
5 2 5 3 5
2 3 2 4 2
4 4 1 5 1
Resuelva las siguientes preguntas:
6. Determine la poblacin del estudio estadstico.
La poblacin la constituyen todos los usuarios de la biblioteca. Incluye los
estudiantes, profesores, empleados y externos que usen los servicios de la
biblioteca.
7. Determine la muestra.
La muestra la conforman las 25 personas entrevistadas para dar la calificacin.
8. Determine la variable de estudio.
La variable de estudio es la calificacin del servicio al usuario de la Biblioteca del
Quindio.
9. La variable es cuantitativa o cualitativa?
Tal como se dise el estudio la variable es cuantitativa de tipo discreto. Tambien
pudo ser cualitativa si se hubiera fijado como posibles respuestas: Excelente,
Bueno, Regular y Malo, por ejemplo.
10. El anlisis estadstico que se pretende realizar se ubica dentro de la
estadstica descriptiva o inferencial?
Se ubica dentro de la estadstica inferencial ya que a partir de la muestra se
buscara deducir las caractersticas de la poblacin. Aunque inicialmente se deben
realizar procedimientos de la estadstica descriptiva para resumir la informacin el
objetivo final es inferir lo que pasa con la poblacin.
11. Construya una tabla de frecuencias para datos no agrupados.
Calificacin fi hi Fi Hi
1 5 5/25 5 5/25
2 5 5/25 10 10/25
3 6 6/25 16 16/25
4 4 4/25 20 20/25
5 5 5/25 25 25/25
Total 25 25/25 25 25/25
12. Interprete F2
Tenemos F2 = 10, quiere decir que 10 personas calificaron 1 o 2.
13. Interprete h1.
Tenemos h1= 5/25, quiere decir que de los 25 entrevistados 5 calificaron con 1 el
servicio de la biblioteca.
14. Interprete f3.
Con f3=6, quiere decir que 6 personas calificaron con 3 el servicio de la biblioteca.
15. Interprete H4.
Con H4= 20/25, quiere decir que 20 de las 25 personas entrevistadas calificaron 4
o menos.
16. Calcule e interprete la media.
(15 ) + ( 25 ) + ( 36 ) + ( 44 ) +(55)
x =
25
5+10+18+16+25 74
x = =
25 25
x =2.96
El valor de la calificacin promedio es de 2.96.
17. Calcule e interprete la mediana.
Primero ordenamos los datos y buscamos el de la mitad:
1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5.
La mediana es 3, este es el valor que se encuentra en la mitad.
18. Calcule e interprete la moda.
La moda es 3, porque es el valor que ms se repite (6 veces).
Supongamos que se investiga el precio de cierto libro en 50 editoriales diferentes y
se encuentra los siguientes datos (en miles de pesos):
72 84 73 76 70 91 93 84 90 91
75 87 71 73 69 93 92 83 96 95
83 88 85 72 73 70 83 81 97 72
93 99 83 71 85 68 82 73 84 83
96 70 81 83 94 73 85 69 86 85
19. Elaborar dos tablas de frecuencias (utilice m=5)
20. Determinar e interpretar el valor F3, f2, h3, H2
21. Elabore dos histogramas de frecuencias
22. Elabore dos polgonos de frecuencias
23. Elabore dos diagramas circular
24. Construya dos grficos de frecuencias acumuladas; Ojiva menor que.
25. Construya dos curvas Ojiva: mayor que.
PRIMER TABLA DE FRECUENCIA
Se consideran cinco intervalos, valor menor 65 y valor mayor=104.
Intervalo Marca fi hi Fi Hi
de clase
65-72 68.5 11 11/50 11 11/50
73-80 76.5 7 7/50 18 18/50
81-88 84.5 19 19/50 37 37/50
89-96 92.5 11 11/50 48 48/50
97-104 100.5 2 2/50 50 50/50
TOTAL 50 50/50 50 50/50
F3= 37 quiere decir que 37 editoriales ofrecen precios de 88 mil pesos o
menores.
f2= 7 quiere decir que 7 editoriales tienen precios entre 73 y 80 mil pesos.
h3= 19/50, quiere decir que 19 de las 50 editoriales tienen precios entre 81
y 88 mil pesos.
H2= 18/50, quiere decir que 18 de las 50 editoriales tienen precios de 80 mil
pesos o inferiores.
Ojiva "Menor que"
60
50
40
Numero de editoriales 30
20
10
0
65 68.5 76.5 84.5 92.5 100.5
Costo en miles de pesos
Ojiva "Mayor que"
60
50
40
Numero de editoriales 30
20
10
0
68.5 76.5 84.5 92.5 100.5 104
Costo en miles de pesos
SEGUNDA TABLA DE FRECUENCIA
Se consideran cinco intervalos, valor menor 65 y valor mayor=99.
Intervalo Marca fi hi Fi Hi
de clase
65-71 68 8 8/50 8 8/50
72-78 75 10 10/50 18 18/50
79-85 82 16 16/50 34 34/50
86-92 89 7 7/50 41 41/50
93-99 96 9 9/50 50 50/50
TOTAL 50 50/50 50 50/50
F3= 34 quiere decir que 34 editoriales ofrecen precios de 85 mil pesos o
menores.
f2= 10 quiere decir que 10 editoriales tienen precios entre 72 y 78 mil
pesos.
h3= 16/50, quiere decir que 16 de las 50 editoriales tienen precios entre 79
y 85 mil pesos.
H2= 18/50, quiere decir que 18 de las 50 editoriales tienen precios de 78 mil
pesos o inferiores.
Histograma de frecuencias 2
20
15
Numero de editoriales 10
0
65-71 72-78 79-85 86-92 93-99
Costo en miles de pesos
BIBLIOGRAFIA
GARRIGA, Ana; LUBIN, Paul; MERINO, Jos y PADILLA, Miguel (2009).
Introduccin en el anlisis de datos. 1 ed. Madrid: Editorial Universidad de
Educacin a Distancia.
MENDENHALL, William; BEAVER, Robert y BEAVER, Barbra (2010).
Introduccin a la probabilidad y estadstica. 13 edicin. CENGAGE Learning
Editores.
PUENTE VIEDMA, Carlos. (2009). Estadstica descriptiva e inferencial y
una introduccin al mtodo cientfico. 1 ed. Madrid: Editorial Complutuense.