0% encontró este documento útil (0 votos)
58 vistas63 páginas

Definiciones Basicas Estadistica

Cargado por

tascent_sonitus
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
58 vistas63 páginas

Definiciones Basicas Estadistica

Cargado por

tascent_sonitus
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA

DESCRIPTIVA
E INFERENCIAL
UPSLP
PRIMAVERA 2016

1
Definiciones básicas
Población: Conjunto de elementos que se quiere estudiar.
• Habitantes de una ciudad.
• Televisores fabricados en una factoría.
• Alumnos de primero de bachillerato.

Muestra: Cualquier subconjunto de una población. El


número de elementos de una muestra se llama tamaño.

Variable estadística : Cada uno de los rasgos o


características que se quiere estudiar de los elementos de
la población, susceptible o no de medida.
• Color del pelo: negro, castaño, rubio o pelirrojo
• Sexo: hombre o mujer
• Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 ,
• Alturas de alumnos:178, 169, 172, 183, …
2
Definiciones básicas
Individuo: Cada uno de los elementos que componen una
población y/o muestra .
• Es sinónimo de unidad básica o última del muestreo

Carácter : Propiedad o cualidad que presentan los


elementos de una población que se desea estudiar .
• Cualitativo cuando no puede medirse numéricamente
• Cuantitativo cuando puede medirse numéricamente (Variable)

Estadístico : Es una medida descriptiva de una muestra


• Ingreso promedio de los trabajadores
• Frecuencia de venta de productos

3
Tipos de Estadística
• La Estadística descriptiva o deductiva:
– Trata del recuento, ordenación y clasificación de
los datos obtenidos de las observaciones:
• Construcción de tablas, gráficos y cálculo de parámetros.

• La Estadística inferencial o inductiva:


– Utiliza los resultados de la estadística
descriptiva y se apoya en el cálculo de
probabilidades para la obtención de
conclusiones sobre una población a partir de los
resultados obtenidos de una muestra.
4
Variables cualitativas y cuantitativas
Ordinales • Escalas
• Etapas

Cualitativas
 (Cualidades ,
• Colores
 categorías o • Lugares
 atributos) Nominales
 • Profesiones

Variables   Discretas • Número de hijos
  (Unidades • Páginas de un libro
Cuantitati vas  completas )
 
 (Aquellas 
 medibles  • Edad
numéricamente) Continuas • Peso
(Cualquier • Talla
valor en un • Tiempo
rango)
5
Tipos de Variables Cualitativas
 Dicotómicas: Sólo hay dos categoría, que son excluyentes una
de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre

 Nominal: tiene mas de dos categorías y no hay orden entre


ellas.
Ejemplo: color de los ojos, grupo sanguíneo

 Ordinal: tiene varias categorías y hay orden entre ellas.


Ejemplo: grado tumoral, calificación del riesgo en
anestesia.

6
Tipos de Variables Cuantitativas

 Continuas: números infinito no numerables de


elementos. Tiene asociado el concepto de medida, en
unidades a veces fraccionarias.
Ejemplo: Presión arterial, Edad, peso.

 Discretas: números finitos o infinitos numerables de


elementos. Se asocia con el concepto de conteo.
Ejemplo: N° de hijos, N° de casos de
tuberculosis por estado.
7
Presentaciones estadísticas y
representaciones gráficas
Son los métodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la máxima
información con una rápida visualización , manejo de
estética y sencilléz operativa . Pueden ser de dos tipos:
• Tablas:
• Forma sencilla y clara de agrupar la información
• Pueden ser sencillas o complejas según la cantidad de datos
• Es importante el manejo lógico de la disposición
• Gráficos:
• Permiten visualizar la información y sus relaciones
• Es una forma ilustrativa y clara de los datos
• Es una forma creativa y artística de presentación
8
Diferentes tipos de medidas
 Las descripciones numéricas de datos son
importantes. Dado un conjunto de n
observaciones :
x1 , x2 ,.....,xn
 La estadística descriptiva nos ayuda mediante el
manejo de medidas de tendencia central
relativas a la posición de los datos y medidas de
dispersión relativas a la variabilidad de los datos.

9
Medidas de Tendencia Central

 Las medidas descriptivas más comunes de


tendencia central o posición son: la media
aritmética y la mediana

 Existen otras medidas de tendencia central que en


ocasiones pueden resultar de interés tales como :
la moda, los cuartiles, los deciles, los percentiles, la
media armónica, la media geométrica y la media
ponderada.

10
Media Aritmética

 La media aritmética es simplemente el promedio


(también llamada media muestral ya que
generalmente se calcula en relación a una muestra).
 Se calcula de la siguiente forma: si las
observaciones de una muestra de tamaño n son x1,
x2,…,xn entonces:
n

x
x 1  x 2  ...  x n i  1
i

X 
n n

11
Mediana

 La mediana se suele definir como el valor “más


intermedio o central ” una vez que los datos han sido
ordenados en forma creciente. Se suele denotar por
Me. La forma más general de calcular la mediana es la
siguiente:  x  n  1 2 si n es impar

Me   x
 n 2  x  ( n 2) 1
 si n es par
 2

12
Moda

 La moda de un conjunto de observaciones es el valor


que más se repite, aquel cuya frecuencia absoluta es
máxima.
 Puede ser única, que haya más de una, o que no
exista.
 Cuando hay más de una , la distribución de los datos
se denomina acorde : bimodal , trimodal, polimodal,
etc.

13
Uso de : Media , Mediana y Moda
Nos brindan una idea muy clara de la “posición” de los
parámetros dentro de una distribución de datos.

• La media tiene el uso más frecuente y sencillo ,


tales como : talla media del mexicano,
temperatura histórica promedio , etc.
• La mediana es representativa en poblaciones
heterogéneas , tales como : distribución de
salarios , peso medio, etc.
• La moda literalmente tiene que ver con “estar de
moda” o lo que más se lleva , tal como: número de
individuos por casa en México, cantidad de
usuarios de ciertos equipos celulares , etc.
14
Relación entre : Media,Mediana y Moda

La forma de distribución de las observaciones puede variar , causando


desviaciones de estas mediciones centrales , por eso es conveniente el
empleo conjunto de la media y la mediana en una población o muestra.

La media se usa para distribuciones simétricas que


no tienen sesgo , mientras que la mediana es más
representativa cuando se tienen datos de
distribución sesgada.
15
Medidas de Dispersión
 Las medidas descriptivas más
comunes de dispersión son: el
rango, la varianza y la desviación
estándar .

 Existen otras medidas de


dispersión que en ocasiones
pueden resultar de interés tales
como : rango semi-intercuartilar ,
rango percentilar y coeficiente de
variación.

16
Rango
 El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas
 Como valor se define como la diferencia entre la observación más grande y la más pequeña :

 Indica el ancho, recorrido o amplitud de valores . Tiene como sus límites el valor mayor y el menor en la
distribución de datos.

r  xmax  xmin

17
Varianza

 Es una medida significativa de la dispersión de las


observaciones alrededor de la media.
 Se define como el promedio de las desviaciones respecto
a su media , elevadas al cuadrado :
n n

 (x  x)
i
2
 (x  x)
i
2

s 
2 i 1
s  2 i 1
n n

18
Desviación estándar

 Es una medida significativa de la dispersión de las


observaciones alrededor de la media.
 Se define como la raíz cuadrada del promedio de las
desviaciones respecto a su media , elevadas al cuadrado ;
es decir la raíz cuadrada de la varianza :

 (x  x)
i
2

 i 1
n

19
ORGANIZACIÓN
DE DATOS
ESTRUCTURA E INTERPRETACIÓN: CUADROS
ESTADÍSTICOS
DISTRIBUCIÓN DE
FRECUENCIAS
Todo cuadro numérico debe tener:
- Un título adecuado para evitar confusiones y para expresar
brevemente su contenido.
- La fuente de los datos, si no son datos propios.
- Las unidades en que se expresan los datos.
DISTRIBUCIÓN DE
FRECUENCIAS
Los cuadros numéricos de una sola variable
estadística se denominan distribución de
frecuencias.
En el procedimiento para construir
distribuciones de frecuencias nos referiremos a
muestras, mientras no se diga lo contrario.
DISTRIBUCIÓN DE
FRECUENCIAS: Variable
cualitativa
Una distribución de frecuencias es un sistema de clasificación que
revela la forma de variación de la variable en estudio.
El recorrido de la variable, que son las categorías, las clases ó
intervalos en los cuales el investigador desea analizar la variable acorde
a los fundamentos estadísticos y los objetivos de la investigación, se
necesitan para obtener una distribución de frecuencia.
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cualitativa
Supongamos que en una muestra de n unidades estadísticas se observan
k categorías o modalidades diferentes C1 , C2, …Ck de alguna variable
cualitativa x
La tabulación de estos n datos, es la distribución de frecuencias por
categorías.
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cualitativa
La frecuencia absoluta ni es el número de datos observados en cada
categoría o modalidad. La suma de todas las frecuencias absolutas es
igual al total n de datos observados.
La frecuencia relativa hi se define en cada categoría por hi = ni / n. La
suma de todas las frecuencias relativas es igual a uno.
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cualitativa
La frecuencia Porcentual h se define en cada fila como h
i(100) =hx i(100) i
100% . El total de las frecuencias porcentuales es igual a cien.
Distribución de frecuencias de variable cualitativa

Categorías de la variable Frecuencias Frecuencias Frecuencias


x absolutas ni relativas hi porcentual hi(100)

C1 n1 h1 h1(100)
C2 n2 h2 h2(100)
… … … …
Ck nk hk hk(100)
Total n 1.00 100.00
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cualitativa
Ejemplo: En una encuesta de opinión acerca de las preferencias de una
marca de bebida gaseosa por sus colores: Negro(N), Blanco (B) Rojo(R),
20 consumidores dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N,
B, N, N, R, B, N, B, R, B, N,
Construir la distribución de frecuencias.
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cualitativa
La tabulación de estos datos, donde la variable cualitativa es x : Color de
bebida gaseosa, la distribución de frecuencias es:

Valores de x Frecuencias Frecuencias Frecuencias


absolutas ni relativas hi porcentual
hi(100)
Negro (N) 9 0.45 45
Blanco (B) 8 0.40 40
Rojo (R) 3 0.15 15
Total 20 1.00 100
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cuantitativa discreta
Supongamos que se han recolectado n valores de variable discreta x. Se
procede simplemente a ordenar estos n datos, en forma ascendente.
Si todos los n datos son distintos entre sí, se obtendrá una distribución
de frecuencias de n valores de la variable x, donde cada uno de estos
valores tienen frecuencia absoluta igual a uno.
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cuantitativa discreta
La distribución de frecuencias de estos n datos es similar al cuadro para
variable cualitativa.
Distribución de frecuencias de variable discreta

Categorías de la variable Frecuencias Frecuencias Frecuencias


x absolutas ni relativas hi porcentual hi(100)

x1 n1 h1 h1(100)
x2 n2 h2 h2(100)
… … … …
xk nk hk hk(100)
Total n 1.00 100.00
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cuantitativa discreta
Ejemplo: Ante la pregunta del número de hijos por familia (variable x)
una muestra de 20 hogares, marco las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0,
3, 2, 1, 3, 2, 3, 3, 1, 2, 4,
Construir la distribución de frecuencia de la variable x
DISTRIBUCIÓN DE FRECUENCIAS:
Variable cuantitativa discreta
Al ordenar estos datos en forma ascendente, se obtienen 5 valores
distintos 0, 1, 2, 3, 4. La distribución de frecuencias de x será:
La distribución de frecuencias del número de hijos por familia

Números de Frecuencias Frecuencias Frecuencias


absolutas ni relativas hi porcentual
Hijos xi hi(100)
0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100
DISTRIBUCIÓN DE FRECUENCIAS:
Por intervalos
La distribución de frecuencias por intervalos o clases se usa cuando la
variable estadística es continua o cuando el número de valores distintos
de una variable discreta es muy grande (más de 20 líneas en el monitor
de una computadora)
DISTRIBUCIÓN DE
FRECUENCIAS:
Por intervalos
Los intervalos pueden ser:
Abiertos: < > Semiabiertos: < ]; [ > Cerrados: [ ]
Los intervalos pueden ser igual, diferente amplitud o amplitud
cero.
DISTRIBUCIÓN DE
FRECUENCIAS:
Por intervalos
CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIA
Para elaborar una distribución de frecuencia se procede de la siguiente
manera:
1º Se determina el rango: R de variación de los datos que se define
por la diferencia del dato máximo con el mínimo:
R = Max. - Min.
DISTRIBUCIÓN DE
FRECUENCIAS:
Por intervalos
FRECUENCIAS:
Por intervalos
Al momento de elegir los intervalos debemos
considerar hacerlo eligiendo no más de 20 intervalos ni
menos de 5, ya que muchos intervalos pueden
complicar innecesariamente los cálculos de las
medidas descriptivas, y pocos intervalos podrían
omitir características importantes de los datos.
Elegiremos todos los intervalos de igual amplitud C.
DISTRIBUCIÓN DE
FRECUENCIAS: Por
intervalos
3º Determinar la amplitud del
intervalo de clase: C, es la
distancia entre el límite superior y
el límite inferior de una clase o
intervalo; de modo general la
amplitud interválica se obtiene
dividiendo el rango entre el número
de intervalos. Esto es:
C= R/m
DISTRIBUCIÓN DE
FRECUENCIAS: Por
intervalos
Si la división C = R / m; no es exacta en el
número de decimales de los datos,
entonces, el número C se aproxima por
exceso de manera que se cubra todo el
rango, esto es, de manera que m.C ≥ R.
Con este valor de C se forman las clases a
partir del puntaje mínimo.
DISTRIBUCIÓN DE
FRECUENCIAS: Por
intervalos
Ejemplo:
Sean los datos que siguen correspondientes a los calificativos en el curso de
Estadística General de 56 alumnos de la Facultad de Derecho de la Universidad Cesar
Vallejo sede Tarapoto. Siendo la escala de evaluación de 0 a 100.

73 81 44 69 30 38 67 61 87 39 62
75 66 76 84 72 82 75 69 53 79 95
58 89 73 59 87 63 50 38 70 84 82
43 59 64 74 63 63 95 59 75 36 65
48 52 77 68 47 53 72 52 55 75 43
63
DISTRIBUCIÓN DE
FRECUENCIAS: Por
intervalos
Proceso en la elaboración de la distribución (tabla) de frecuencias
1º Rango: max – min. R = 95 – 30 = 65
2º Número de intervalos:
m = 1 + 3,3 log 56 log 56 = 1,748
= 1+ 3,3 (1,748)
= 1+ 5,8
m = 6,8

Pero consideramos que la fórmula de Sturges es conservadora,


entonces para obtener el número que realmente es necesario,
redondeamos al siguiente entero mayor:
m=7
.
DISTRIBUCIÓN DE
FRECUENCIAS:
Por intervalos
4º Amplitud del intervalo: Lo que se quiere es resumir los valores para
observar algunas características o propiedades de los datos, que
no se notan a simple vista. Como tenemos por la fórmula de Sturges 7
intervalos vamos a clasificar las 56 notas en 7 grupos:
El recorrido se dividirá en 7 intervalos:
DISTRIBUCIÓN DE
FRECUENCIAS:
Por intervalos

30 95
Se sabe que la amplitud de cada intervalo se obtiene con la fórmula:
C= R/m en donde R= C.m
Los valores R y m son conocidos R=65 y m=7
DISTRIBUCIÓN DE
FRECUENCIAS:
Por intervalos
Aplicando los datos tenemos:
65
C= = 9, 286
7
Redondeamos a 10, por que no es conveniente escoger el 9 debido a que
nuevo recorrido de trabajo será: R=C.m.=9 x 7 =63, esto daría lugar a que el
dato 95 se encuentre fuera de este recorrido
DISTRIBUCIÓN DE
FRECUENCIAS
En cambio, C = 10 y el nuevo recorrido de trabajo luego de redondear 9,286
a 10 será:
R = C x m = 10 x 7 = 70
Teniendo en cuenta que este recorrido es mayor que el recorrido
original, buscaremos el exceso:
exceso = 70 – 65
exceso = 5
DISTRIBUCIÓN DE
FRECUENCIAS
Este exceso proviene de haber aumentado la amplitud de cada intervalo de
9,286 a 10.
Para buscar la simetría de la distribución de los datos, debemos
repartir este exceso a los dos extremos del recorrido inicial, mitad para cada
lado, pero como 5 ÷ 2 = 2,5 no es número entero, entonces
descomponemos en:
3
5
2
DISTRIBUCIÓN DE
FRECUENCIAS
Luego procedemos a considerar como regla sumarle el mayor número (en
este caso 3) al valor máximo y restamos el menor número (en este caso 2) al
valor mínimo:
95 + 3 = 98 y 30 – 2 = 28
A partir del dato obtenido 28 agregamos sucesivamente la amplitud 10 y
así conseguimos los puntos de división que determinan los 7 intervalos:

28 38 48 58 68 78 88 98
DISTRIBUCIÓN DE
FRECUENCIAS
Adoptaremos por acuerdo de los intervalos vistos al intervalo cerrado por la
derecha y abierto por la izquierda. Que en el lenguaje matemático se
representa por el símbolo: [ >, esto quiere decir si por ejemplo tenemos el
intervalo [28, 38 > este será cerrado por la izquierda que incluye al número
28 y abierto por la derecha que no incluye al número 38.
DISTRIBUCIÓN DE
FRECUENCIAS
El número 38 solo sirve de límite superior para indicar que en el intervalo
puede contener números anteriores a 38, pero no al 38. Por ejemplo podrá
contener al número 37, 9 y el número 37,98 o al 37,999 si es que lo hubiera,
pero nunca llegará a incluir al número 38.
DISTRIBUCIÓN DE
FRECUENCIAS
En cambio si se podrá incluir en el siguiente intervalo: [38, 48 >,
contiene al número 38 pero no al 48.
Los intervalos deben colocarse en forma de columna de tal
forma que dará origen a la distribución de frecuencia que
vamos a formar.
Intervalos
O clases
[28, 38 >
[38, 48 >
[48, 58 >
[58, 68 >
[68, 78 >
[78, 88 >
[88, 98 >
DISTRIBUCIÓN DE
FRECUENCIAS
Vamos a considerar el intervalo cerrado por la
izquierda y abierto por la derecha representando del
modo con la finalidad de expresar con
mayor comodidad los datos. Tendríamos entonces los
intervalos expresados de la siguiente forma:
Intervalos
O clases

28 38
38 48
48 58
58 68

68 78

78 88
88 98
DISTRIBUCIÓN DE
FRECUENCIAS
4º La marca de Clase: Y El siguiente paso es
i ponernos de acuerdo
que todos y cada uno de los datos que se hallen dentro de un
mismo intervalo, estén representados por un mismo valor.
Este valor caracteriza a la clase y por eso se llama marca de clase,
se obtiene promediando los extremos de cada variable. Las
marcas de clase de cada intervalo son:
DISTRIBUCIÓN DE
FRECUENCIAS
28 + 38 48 + 58 68 + 78 88 + 98
= 33 = 53 = 73 = 93
2 2 2 2

38 + 48 58 + 68 78 + 88
= 43 = 63 = 83
2 2 2
DISTRIBUCIÓN DE
FRECUENCIAS
5° Ahora encontraremos la frecuencia absoluta ni ; la
frecuencia absoluta se obtiene colocando cada uno
de los datos en el intervalo que le corresponde. A
medida que le asignemos un dato a un intervalo lo
representaremos en la columna de conteo del
cuadro, puede ser por medio de una tarja o palote.
Una vez que acabamos de asignar todos los datos a
un intervalo determinado, todos ellos estarán
representados por la marca de clase de dicho
intervalo. Procedemos de la siguiente manera:
DISTRIBUCIÓN DE
FRECUENCIAS
El primer intervalo es 28 38 cerrado en 28 y
abierto en 38, luego buscamos que datos se
encuentran en ese intervalo y esto son: 30 y 36. En ese
intervalo pertenecen entonces 2 datos de la muestra.
En el segundo intervalo 38 48 encontramos los
valores: 38, 38, 39, 43, 43, 44 y 47. Entonces en este
intervalo encontramos 7 datos y lo expresamos
escribiendo en la columna de frecuencias absolutas.
Realizamos esta misma operación con cada uno de los
intervalos.
DISTRIBUCIÓN DE
FRECUENCIAS
La frecuencia absoluta nos ayuda a interpretar los
datos de esta forma:
n3 = 7, es decir 7 alumnos tienen un calificativo en
el curso de Estadística entre 48 y 58. En el n4 = 14, es
decir 14 alumnos tienen un calificativo en el curso de
Estadística entre 58 y 68. La sumatoria de los ni = n =
56 para este ejemplo.
DISTRIBUCIÓN DE
6ºFRECUENCIAS
Encontrar las frecuencias relativas: h se obtiene
i por
división de ni n así:
h1= n1 /n = 2 ÷ 56 = 0,0357
h2 = n2 /n = 7 ÷ 56 = 0,1250
h3= n3 /n = 7 ÷ 56 = 0,1250
h4 = n4 /n = 14 ÷ 56 = 0,2500
h5 = n5 /n = 15 ÷ 56 = 0,2679
h6 = n6 /n = 8 ÷ 56 = 0,1429
h7 = n2 /n = 3 ÷ 56 = 0,0536
La sumatoria de los hi nos da la unidad o
aproximadamente 1, al graficar estas frecuencia se
obtiene la distribución de probabilidad.
DISTRIBUCIÓN DE
7ºFRECUENCIAS
Luego las frecuencias acumuladas: N se obtiene j sumando
iterativamente las frecuencias absolutas así:

N1= 2;
N2 = n1 + n2 = 2 + 7 = 9;
N3 = n1 + n2 + n3 = 2 + 7 + 7 = 16;
N4 = n1 + n2 + n3 + n4 = 2 + 7 + 7 + 14 = 30
N5 = n1 + n2 + n3 + n4 + n5 = 2 + 7 + 7 + 14 + 15 = 45
N6 = n1 + n2 + n3 + n4 + n5 + n6 = 2 + 7 + 7 + 14 + 15 + 8 = 53
N7 = n1 + n2 + n3 + n4 + n5 + n6 + n7 = 2 + 7 + 7 + 14 + 15 + 8 + 3 = 56

La última frecuencia acumulada, en este caso N7, es igual al


tamaño de la muestra, las frecuencias acumuladas se usan para
construir la ojiva o polígono acumulativo.
DISTRIBUCIÓN DE
8ºFRECUENCIAS
Por último podemos construir las frecuencias porcentuales: h (100) ó %.
i
Resulta de multiplicar la frecuencia relativa hi por 100, así:
h1(100) = 0,0357 (100) = 3, 57
h2(100) = 0,1250 (100) = 12, 5
h3(100) = 0,1250 (100) = 12, 5
h4(100) = 0,2500(100) = 25, 0
h5(100) = 0,2679 (100) = 26,79
h6(100) = 0,1429 (100) = 14,29
h7(100) = 0,0536 (100) = 5,36
El uso de porcentajes nos permite comparar las frecuencias en igual o
diferente tamaño de muestra, siempre que se tenga idénticos los límites
de clase. Nos permite hacer inferencias a partir de los datos de la
muestra tomada para la investigación siempre que sea representativa y
adecuada.
DISTRIBUCIÓN DE
FRECUENCIAS
Intervalos Yi ni hi Nj hi(100) ó %
O clases

28 38 33 2 0,0357 2 3, 57

38 48 43 7 0,1250 9 12, 5

48 58 53 7 0,1250 16 12, 5

58 68 63 14 0,2500 30 25, 0

73 15 0,2679 45 26,79
68 78

78 88 83 8 0,1429 53 14,29

88 98 93 3 0,0536 56 5,36
Ejercicio de Aplicación
1.- La inversión real (en miles de dólares) anual de un
grupo de pequeñas empresas fueron:
10 12 8 40 6 8 10 30 2 8 6 14
16 20 25 28 30 26 30 4 6 10 18 17
13 17 21 7 6 8 14 7 15 19 27 22
0 14 6 8 9 11 13 15 18 20 30 60
12 6 5 5 6 8 7 12 15 36 39 52
Se pide formar una tabla de todas las distribuciones de
frecuencias, con intervalos de amplitud constante.
Utilidad de las medidas de dispersión
 Las medidas centrales solo nos indican el valor medio
alrededor del cual se agrupan nuestros datos , pero las de
dispersión nos detallan la variación de las observaciones en
cuanto a forma y extensión.

 Nos muestran claramente la distancia entre los datos y la


media aritmética, además de que dependen de todas las
observaciones.

 Son únicas de una serie de datos y por eso se denominan


absolutas , pero pierden sentido de comparación , para lo
cual hay que usar el coeficiente de variación (desviación
estándar sobre
la media en porcentaje) .

62
BIBLIOGRAFÍA

1) Spiegel, Murray R. y Stephens, Larry J. (2001).


Estadística serie Schaum. México: McGraw-Hill, pp. 1 –
124
2) Domínguez, Jorge. (2009). Estadística y probabilidad. El
Mundo de los datos y el azar. México: Oxford University
Press. Unidad 3: Resumen y organización de datos, pp. 76
a 129.

63

También podría gustarte