Definiciones y Conceptos de Estadística
Definiciones y Conceptos de Estadística
2. El objetivo fundamental de la teoría estadística, consiste en investigar la posibilidad de extraer de los datos estadísticos, inferencias válidas,
elaborando los métodos, mediante los cuales pueden obtenerse dichas inferencias. Esta definición hace énfasis en la estadística como método para obtener
inferencias válidas, es decir, se basa en el muestreo.
ESTADISTICA DESCRIPTIVA O DEDUCTIVA: Es aquella que se realiza tomando en cuenta todos los elementos de la población y de ellos se
obtienen los datos para encontrar o determinar las características del fenómeno. También se dice que, es la rama de la estadística que para su estudio
toma en cuenta todos los elementos unidades de la población, es decir, se obtiene mediante un censo.
ESTADISTICA INFERENCIAL O INDUCTIVA: Es la rama de la estadística que nos proporciona normas y reglas para encontrar las
características de la población, tomando una muestra. Permite conocer algún aspecto de la población por medio de una muestra.
POBLACION: Es el conjunto total de elementos que se desean investigar. Existe cuando se investigan todas las unidades, es decir, se levanta un censo.
MUESTRA: Es una parte de la población. Existen dos tipos: Pirobalística o al Azar y De criterio o juicio
1. MUESTRA PROBALISTICA O AL AZAR: Es cuando cada elemento de la población tiene una oportunidad conocida de ser
seleccionado en la muestra.
2. DE CRITERIO O JUICIO, SUBJETIVA: Es cuando la selección de los elementos a incluir en la muestra se hace utilizando el criterio
personal.
DISTRIBUCION DE FRECUENCIAS:
DEFINICION: Se denomina distribución de frecuencias a una tabla que utilizando filas y columnas que se utiliza para presentar datos “clasificados”
sobre variables.
TIPOS DE DISTRIBUCION:
1.) SERIE SIMPLE AGRUPADA, EJEMPLO:
Salarios Mensuales Q No. Empleados
1,500.00 3
1,800.00 5
2,000.00 8
2,500.00 3
3,000.00 1
TOTAL (n) 20
FRECUENCIA: Indica las veces que se repite la variable. Se identifica con el símbolo f y está expresada en valores absolutos. (En el ejemplo anterior
las frecuencias están representadas en la columna de No. De empresas).
FRECUENCIAS ABSOLUTAS: Se refiere al número de repeticiones de la variable en cada clase. Su símbolo es “f”. En el ejemplo anterior son
3,7,15, 6 y 4.
FRECUENCIAS RELATIVAS: Se obtienen de dividir las frecuencias absolutas de cada clase entre el total de casos. Si se multiplican por 100
quedan expresadas en porcentajes. Su símbolo es f’. La sumatoria de las frecuencias relativas debe ser igual a 1 ó aproximadamente 1 por
aproximación de cálculos, o bien al 100%.
FRECUENCIAS ACUMULADAS: Para obtenerlas, se copia el primer valor de la frecuencia absoluta y se le va sumando las demás frecuencias
absolutas de cada clase. De esta manera el dato de la última clase deberá ser igual al total de casos. Su símbolo es F.
FRECUENCIAS ACUMULADAS RELATIVAS: Estas se obtienen de dividir las frecuencias acumuladas de cada clase entre el total de casos.
Si se multiplican por 100 quedan expresadas en porcentajes. Su símbolo es F’.
Ventas Mensuales No. Empresas (f) (F¨)
(Miles de Q)
15 – 16 3 8.57%
17 – 18 7 28.57%
19 – 20 15 71.43%
21 – 22 6 88.57%
23 – 24 4 100.00%
TOTAL (n) 35 Xxx
RECORRIDO O RANGO DE LA VARIABLE (Símbolo “R”) Es igual al valor máximo menos el valor mínimo mas uno. Comúnmente
se dice que es “DESDE DONDE EMPIEZAN LOS DATOS HASTA DONDE TERMINAN”.
R = Valor Máximo (-) Valor Mínimo (+) 1
Ej: 24 – 15 + 1 =10
CLASE O GRUPO: (Símbolo “C”) Es una de las partes en que se ha dividido el rango o recorrido de la variable. Ej: De 15 a 16 es la primera clase.
INTERVALO DE CLASE: SIMBOLO (Símbolo “I” ) Es la diferencia entre el límite superior y el límite inferior de la clase más la unidad. Ls -
Li + 1 = I
LIMITES DE CLASE: Los valores extremos en cada clase constituyen los límites, los del lado izquierdo son los límites inferiores y los del lado
derecho son los superiores. Límites Inferiores (Li) y Límites Superiores (Ls) Dentro de los Límites de Clase se identifican 2 tipos:
¾ DISCRETOS O APARENTES Están representados en valores enteros, es decir no están representados en forma fraccionada. Ej. De 15 a 16.
¾ REALES O VERDADEROS: Para encontrar los valores reales de los límites de clase se procede de la siguiente forma: a los inferiores se les
resta media unidad y a los superiores se les suma media unidad. Ej. De 14.5 a 16.5
Tipos de Intervalos:
¾ Constantes (Clases de igual tamaño)
¾ Variables (fiel a su concepto)
¾ Abiertos (Uno de ellos es abierto)
MARCA DE CLASE O PUNTO MEDIO (X) Es la semi-suma de los límites de clase. Es el punto medio del intervalo para cada clase y se
obtiene de la semi-suma de los límites.
X = Ls + Li X = Lrs + Lri
2 2
Cuando el intervalo es constante, se encuentra el punto medio de la primera clase y para los siguientes, únicamente hay que sumarle el intervalo
constante.
1 + 3.322 (Log. n)
SIMBOLOGIA
RANGO= (VALOR MÁXIMO - VALOR MINIMO) + 1
Denominador = 1 + 3.322 (Constantes)
Log n = Logaritmo Decimal del Numero de Elementos
N= Número de Datos
3) Determinar o calcular del número posible de clases, que se obtiene de la siguiente manera.
Número de Clases = Rango o Recorrido
Intervalo de Clase
4) Definir el límite inicial de la primera clase, esto significa tomar la decisión si se inicia con el valor menor observado, o bien uno un tanto inferior.
5) Seleccionar el mejor arreglo.
REPRESENTACIÓN GRAFICA:
Las gráficas utilizadas en el curso para la representación gráfica de una distribución de frecuencias son:
¾ HISTOGRAMA DE PEARSON: Es un gráfico de barras de una distribución de frecuencias. Los límites reales de clase se colocan en el eje
horizontal (eje de X) y el número de observaciones en el eje vertical (eje de Y).
¾ POLÍGONO DE FRECUENCIAS: Es un gráfico de líneas, que se realiza trazando las mismas sobre las marcas de clase. Puede obtenerse uniendo
los puntos medios del histograma, o bien utilizando las marcas de clase.
¾ OJIVA DE GALTON: Este se elabora tomando de base las frecuencias acumuladas.
H is to g ra m a
16 15
No. de ventas al dia (f)
14
12
10 8
8 7
6 4 4
4 3 3
2 1
0
13 . 5 17.5 21 .5 2 5. 5 29.5 33.5 3 7.5 41.5
V e n ta s e n m ile s d e Q . (x )
DEFINICION: Se les llama Medidas de Tendencia Central porque los valores obtenidos o calculados tienden a situarse al centro de los valores de la
variable, Entre ellas se mencionan:
1. Media o Promedio Aritmético
2. Media Geométrica
3. Media Armónica
4. Otras : Mediana y Moda (Cuando su comportamiento es Simétrico)
1. MEDIA O PROMEDIO ARITMETICO Es una medida de tendencia central que se define como el valor teórico más representativo de una
distribución.
Características
1. Su cálculo está basado en todos los valores por tanto está afectada por valores extremos.
2. Está definida algebraicamente o sea que la fórmula de la media es una ecuación, en donde si se conocen dos de los tres datos el tercero puede ser
obtenido. Ejemplo: La estadística de salarios de un grupo de trabajadores es la siguiente: el promedio gana 2,100.00 y sumados es igual a Q. 8.400.00.
Mes X
Ene 2
Ejemplo de Serie simple
Feb 3
Mar 6
X= 27 = 4.5
Abr 3
6
May 9
Jun 4
27
Cálculo de la Media
Clases f x fx
35 - 40 4 37.5 150
41 - 46 5 43.5 217.5
47 - 52 8 49.5 396
53 - 58 14 55.5 777
59 - 64 8 61.5 492
65 - 70 4 67.5 270
71 - 76 3 73.5 220.5
N = 46 Σ 2523
Mes X x-P
B) La suma algebraica de las desviaciones respecto a cualquier otro Ene 2 -4
valor que no sea la media aritmética no es igual a cero.
Feb 3 -3
Σ (X - P) = 0 y Mar 6 0
Σ f(X - P) = 0 Abr 3 -3
May 9 3
Donde:
P = valor diferente a la media aritmética Jun 4 -2
Suponer P = 6 27 -9
C.) La suma algebraica de las desviaciones respecto a la media al cuadrado es menor que la suma algebraica de las desviaciones respecto a cualquier
otro valor al cuadrado.
Σ (x - X) ² Σ (x - P) ² Serie Simple
Σ f(x - X) ² Σ f(x - P) ² Serie Agrupada
MEDIA DE MEDIAS Cuando se desea obtener un promedio como resultado de mas de un promedio se denomina “media de medias”.
SIMBOLO: X x
Ejemplo Los promedios de calificaciones de un estudiante durante los últimos cuatro semestres son los siguientes:
X1 = 64, X2 = 68, X3 = 70 y X4 = 65
Se pide: Calcular el promedio de los cuatro semestres. Xx = 64 + 68 +70 +65 = 267 Xx = 66.75
4 4
Otro Ejemplo
Cinco grupos de trabajadores formados por 25, 30, 15, 23 y 22 personas, registran un promedio de ingresos de Q 800.00, Q 900.00, Q 950.00, Q
1,000.00 y Q 1,050.00 respectivamente. Se pide: Calcular el promedio de ingresos mensual de los trabajadores.
RESOLUCIÓN
a) El promedio de sueldos para la categoría “Ejecutivos” Xx = 8(6,400.40)+ 2(4,800.00) = 51,203.20 + 9,600.00 = Q 6,080.32
8+2 10
MEDIA DE PORCENTAJES (X %)
EJEMPLO 1
Una firma de auditoria externa decidió hacer una auditoria total Cuenta Auditor Monto Saldo % Auditado
a las cuentas de la empresa “El Éxito”. A los 10 días hábiles se
solicitó un informe del avance del trabajo, el cual se indicó, así: Caja A 850,900.00 34%
Se pide:
Bancos B 965,500.00 68%
A) El promedio porcentual de revisión
B) El monto real de saldos revisados y Mob y E C 114,600.00 85%
C) Comprobar el inciso B) con el promedio revisado
RESOLUCION
Cuenta Auditor Monto % Cantidad
a) El promedio porcentual de revisión
Saldo Auditoria Auditada
X % = 1,043,256.00 = X % = 54.026722 % Caja A 850,900.00 34% 289,306.00
1,931,000.00 Bancos B 965,500.00 68% 656,540.00
Mob y Eq. C 114,600.00 85% 97,410.00
Totales 1,931,000.00 1,043,256.00
b) El monto real de saldos revisados R/ = 1, 043,256.00
Saldos X% % Revisado
850,900.00 0.54026722 459,713.38
c) Comprobar el inciso B) con el promedio revisado
965,500.00 0.54026722 521,628.00
114,600.00 0.54026722 61,914.62
1,043,256.00
Ejemplo 2: (X %
Los descuentos por pronto pago efectuados a los clientes durante el último trimestre: abril 10% sobre Q 20,000.00, Mayo el 12% sobre Q 18,000.00 y
Junio el 10% sobre Q 15,000.00. Se pide:
a) El promedio porcentual de descuentos del trimestre
b) El monto real de los descuentos concedidos; y
c) Comprobar el inciso b) con el promedio obtenido.
RESOLUCION:
Monto % Descuento Q
a) El promedio porcentual de descuentos del trimestre
X % = 5,660 = 10.679% 20,000 10 2,000
53,000
b) El monto real de los descuentos concedidos = Q 5,660.00 18,000 12 2,160
15000 10 1,500
c) Comprobar el inciso b) con el promedio obtenido
10.679 x 53,000 = 5,660.00 53,000 5,660
100
2. MEDIA GEOMÉTRICA (Mg) Es otra medida estadística de tendencia central, que se define como la raíz enésima del producto de los valores.
Sirve especialmente para:
¾ Determinar un promedio geométrico,
¾ Obtener una tasa de crecimiento, (esta última se aplica para pronosticar).
¾ Sirve para calcular la media cuando existe una progresión geométrica.
¾ Para el cálculo de números índices.
¾ Para promediar razones.
FORMULAS: n
Mg = (X1) (X2) … (Xn) O bien: Log. Mg. = Σ Log X Luego Antilogaritmo
N
Donde: X = Variable
N = Número de Periodos en Estudio
EJEMPLO 1
3 3
Se le pide calcular la Mg de 2, 4 y 8. Mg = (2) (4) (8) = 64 = Mg 4
Ejemplo 2 Los gastos de una empresa en los últimos 5 meses fueron los siguientes:
Meses Gastos
La administración de la empresa solicita:
Marzo 90,000
a) La tasa promedio geométrica mensual de los gastos
b) Los gastos para el mes de Agosto 2003 Abril 80,000
c) El promedio geométrico de gastos mensuales, al mes de julio.
Mayo 60,000
Junio 50,000
Julio 45,000
4
También se puede utilizar la siguiente fórmula: r = 45,000 - 1 r = -0.159 = 16.00% o 15.9%
90,000
DATOS
VELOCIDAD HORAS EMPLEADAS Cálculo de la media aritmética:
Guate. - Zacapa 50 3 X = Σ x = 80 = 40 km/hora
Zacapa – Guate. 30 5 N 2
80 8
Cálculo de la Mh:
Mh = N = 2 = 2 = 37.50 Kms./Hora.
Σ 1 /x 1/50 + 1/30 0.02 + 0.033
Comprobación:
Velocidad * Tiempo = Distancia a. Existe una constante: La distancia = 300 Kms
X = 40 * 8 = 320 b. Existen 2 variables: Velocidad y el tiempo.
Ma = 37.5 * 8 = 300 c. Existe una razón o relación
Distancia = Velocidad.
# Horas
Ejemplo 2
Una empresa quiere entregar un pedido de 600 unidades. Asigna igual número de unidades a cada trabajador, si cuenta con tres trabajadores para
elaborarlas, con un rendimiento de:
Desarrollo
Trabajador Unidad / Hora 1/X
X 8 1/8 0.1250
B 14 1/14 0.0714
C 17 1/17 0.0588
0.2552
a) El promedio de unidades por hora b) La cantidad de horas que necesita cada trabajador
Mh = 3 = 11.75 = 12 unidades/hora 200 / 8 = 25
0.2552 200 / 14 = 1 = 50 HORAS
200 / 17 = 11
b) Comprobación 25 x 12 = 300
14 x 12 = 168 o bien 50 x 12 = 600 Unidades
11 x 12 = 132
600 Unidades.
4. MEDIA PONDERADA (Xw) Es aquella que calculamos de acuerdo a valores de la variable que dependen de cierta ponderación o importancia.
Fórmula: Xw = W1X1 + W2X2 + ….WnXn
w1 + w2 +…. Wn
Donde: W = Ponderación o importancia
Ejemplo
El examen final del curso se valora como 3 veces los exámenes parciales y un estudiante obtuvo en el examen final 80 puntos, 75 y 82 en los exámenes
parciales cual fue su nota final?
Xw = 1(75) + 1(82) + 3(80) = 397 = 79..32 = 79
1 + 1 + 3 5
5. MODA (Símbolo Mo)
Es una medida de tendencia central
Es el valor que se repite el mayor numero se veces
Es el valor que tiene la máxima frecuencia
Clases f x fx
35 - 40 4 37.5 150
41 - 46 5 43.5 217.5
47 - 52 8 49.5 396
53 - 58 14 55.5 777
59 - 64 8 61.5 492
65 - 70 4 67.5 270
71 - 76 3 73.5 220.5
N = 46 Σ 2523
Paso No. 2: Tomar los datos que solicita la fórmula (En base a la Clase Modal ya identificada)
Datos:
Li = 52.5 (53 – 0.5)
1 = 6 (14 – 8)
2 = 6 ( 14 – 8)
I = 6 I = Es igual al intervalo de la clase modal,
Interpretación: El valor del ISR que más se repite entre los 46 contribuyentes analizados es de 55.5 Miles de Q.
6. LA MEDIANA (Md) Es la media de tendencia central que divide los datos en dos grupos iguales, uno con los valores inferiores a la mediana y
el otro con valores superiores a la mediana. Se define también, como aquel valor que alcanza el 50% de los casos y es superado por el otro 50%
A) Serie Impar 3, 5, 6, 8, 9, Md = 6
B) Serie Par: 3, 5, 6, 8, 9, 10
Para este caso la Md es igual a la suma de los dos términos centrales dividido entre 2. Md = (6 + 8)
2 Md = 7
C) Serie agrupada en clases: Formula Md = Li + ( N/2) - Fa * I
F
Donde: Li = Límite real inferior de la clase Md.
N = Número de elementos
2 = Número Constante
Fa = Frecuencias Ac. Anterior a la clase Md
F = Frecuencias absolutas de la clase Md
I = Intervalo de la clase Md.
Calculo de la Mediana - Md – Se pide: Determinar el valor de ISR que deja bajo sí a 23 contribuyentes.
Clases f x fx F
35 - 40 4 37.5 150 4
41 - 46 5 43.5 217.5 9
47 - 52 8 49.5 396 17
53 - 58 14 55.5 777 31
59 - 64 8 61.5 492 39
65 - 70 4 67.5 270 43
71 - 76 3 73.5 220.5 46
N = 46 Σ 2523
Paso No. 2: Identificar la clase Md. Para ello se utiliza la siguiente la parte de la fórmula:
N/2 = Representa el 50% de los datos, el resultado se buscan en la columna “F” para ver en que clase se alcanza o es superado.
46/2 = 23 Este valor se localiza en la distribución en la columna de “F”
Clases F x fx F
35 - 40 4 37.5 150 4
41 - 46 5 43.5 217.5 9
47 - 52 8 49.5 396 17
Clase Md 53 - 58 14 55.5 777 31
59 - 64 8 61.5 492 39
65 - 70 4 67.5 270 43
71 - 76 3 73.5 220.5 46
N = 46 Σ 2523
Paso No. 3: Tomar los datos que solicita la fórmula (En base a la Clase Mediana ya identificada)
Datos: Li = 52.5 (53 – 0.5)
N = 46
2 = 2
Fa = 17
f = 14
I = 6
CARACTERISTICAS DE LA Md
¾ No está afectada por los valores extremos
¾ No está definida algebraicamente como la media.
PERCENTILES EN GENERAL
CUARTILES (símbolo Q): Estos dividen a una distribución en cuatro partes iguales. De esa manera se tiene que:
Q1 = Es el valor que alcanza el 25% de los casos
Q2 = Es el valor que alcanza el 50% de los casos = Md.
Q3 = Es el valor que alcanza el 75% de los casos.
DECILES: (símbolo D): Estos dividen a la dist. El 10 partes iguales, así tenemos que:
D1 = Es el valor que alcanza el 10% de los casos y es superado por el 90%
D2 = Es el valor que alcanza el 20% de los casos y es superado por el 80%
PERCENTILES (símbolo P): Dividen la distribución en 100 partes iguales.
Ejemplo Encontrar el valor del ISR, que es superado por el 25% de los contribuyentes (Arriba de dicho valor solo hay 25% = 75%)
Paso No. 1: Identificar la clase Percentil. Para ello se utiliza la siguiente la parte de la fórmula: X (N/100)
75 (46/100) = 34.5 Este valor se localiza en la distribución en la columna de “F”
Clases f x fx F
35 - 40 4 37.5 150 4
41 - 46 5 43.5 217.5 9
47 - 52 8 49.5 396 17
53 - 58 14 55.5 777 31
59 - 64 8 61.5 492 39
65 - 70 4 67.5 270 43
71 - 76 3 73.5 220.5 46
N = 46 Σ 2523
Paso No. 2: Tomar los datos que solicita la fórmula (En base a la Clase Percentil ya identificada)
Datos: Li = 58.5 (59 – 0.5)
X (N/100) = 75 (46/100) = 34.5
Fa = 31
f = 8
I = 6
Paso No. 3: Aplicar la Fórmula: P75 = 58.5 + (34.5) - 31 .6 P75 = 58.5 + (0.4375) .6
8
P75 = 58.5 + 2.625 P75 = 61.12 Miles de Q
Interpretación: El valor que es superado por el 25% de los contribuyentes es de 61.12 Miles de Q.
Otro Ejemplo: Encontrar los valores del ISR que limitan el 40% de los contribuyentes
40% Central
30% 70%
P30 P70
P30 = 46.5 + (13.8) - 9 .6 P30 = 50.1 Miles Q.
8