Tema 20. Calculo Estadistico
Tema 20. Calculo Estadistico
Esta obra científica ha sido creada por los autores con carácter docente y su contenido ha sido inscrito
y registrado en el Registro Territorial de la Propiedad Intelectual de Madrid con Nº de Solicitud y con Nº
de Referencia arriba indicados, otorgando al presente documento y a su autor los derechos recogidos
en Ley de Propiedad Intelectual (Texto Refundido aprobado por Real Decreto Legislativo 1/1996, de 12
de abril)
A tal efecto, queda prohibido el plagio o copia del mismo según la Ley de propiedad intelectual y artística
vigente. Asimismo queda totalmente prohibida la reproducción total o parcial de cualquiera de sus
apartados en cualquier soporte mecánico o digital sin el consentimiento por escrito del propietario y sin
hacer mención a la fuente y al autor.
En caso contrario, se incurrirá en un delito tipificado en los Artículos 270, 271 y 272 del Código Penal
(Ley Orgánica 10/1995, de 23 de noviembre, del Código Penal -Última modificación del 28 de abril de
2015) sobre los Delitos relativos a la Propiedad Intelectual e Industrial, al Mercado y a los Consumidores
y podrá por tanto ser perseguido por ello.
ÍNDICE DE CONTENIDOS
La Estadística suele definirse como la ciencia que tiene por objeto recoger de forma agrupada la información que se produce
de fenómenos repetitivos o no ocasionales.
En su origen la Estadística se desarrolló en la economía y en la política, de hecho hasta bien entrado el siglo XIX la
"Estadística" se utilizaba para hacer mención a informaciones de tipo socioeconómico sobre la realidad de un Estado
(establecimiento de registros de población, nacimientos, defunciones, etc.; censos de edificios y de elementos de riqueza,
etc.)
Hoy, la Estadística no queda reservada al estudio del Estado sino que es algo más amplio y útil en múltiples ciencias y áreas
del conocimiento humano.
Actualmente, en su definición más común se le reconoce como "la ciencia que se ocupa de la obtención de información y
que proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre" o "La rama del
método científico que se ocupa de los datos obtenidos contando o midiendo las propiedades de determinados colectivos”;
a estos colectivos, se le denomina en Estadística “Poblaciones”.
La Estadística suele dividirse en dos grandes apartados: La Estadística Descriptiva, que recoge un conjunto de técnicas
y procedimientos para organizar, resumir y tratar sistemáticamente datos disponibles de sucesos ya acaecidos y La
Estadística Inferencial o Inferencia Estadística, que, basada en la teoría matemática de la Probabilidad, estudia los
métodos empleados para inferir algo acerca de una población basándose en la información aportada por una parte del
colectivo (muestra).
− Muestra: Es una parte de un colectivo, población o universo, que se va a estudiar para ver si es representativa del
mismo.
− Datos: Son los caracteres o características (hechos, fenómenos, objetos, etc.), de un colectivo o de una muestra,
susceptibles o no de ser medidos. Suelen ser dispersos y no tienen un único valor o atributo constante, y no nos
dicen nada salvo si los ordenamos o clasificamos para apreciar cómo están distribuidos, apoyándonos en tablas
de frecuencia.
o Atributos
VARIABLES
Son los caracteres o características que pueden tomar un valor cualquiera dentro de un conjunto determinado de ellos
(dominio de la variable), observados cuantitativamente mediante una medida y/o escala de medidas.
o Si puede tomar cualquier valor entre dos valores dados se llamará variable continua (por ejemplo: la altura,
el peso de las personas, etc.…)
o Si entre dos valores dados consecutivos no puede tomar otro, se llamará variable discreta (por ejemplo:
número de hijos, árboles, etc.). Se suele designar con las últimas letras del abecedario en mayúsculas y los
valores que pueden tomar en minúsculas afectadas por un subíndice. (por ejemplo variable valores
x1,x2,x3,…..xn, a la diferencia entre el mayor y menor valor de la variable, se le llama rango o recorrido de
la variable)
ATRIBUTOS
Son los caracteres o características no susceptibles de ser medidos (ejemplo: sexo, religión, grupo sanguíneo, etc.…)
Se suelen designar por las primeras letras del abecedario en mayúsculas y las modalidades o categorías que pueden tomar
en minúsculas. (Por ejemplo: Atributos/Modalidades/Categorías)
o Todos los datos deben estar clasificados entre las diferentes categorías de un atributo.
MEDIDAS
Medir es aplicar un número (símbolo) a un evento, fenómeno, objeto, individuos, o relación, facilitando su comparación de
forma directa o indirecta (ya que las características humanas, hechos sociales, etc. no son medibles en sí mismas.
Se denomina Distribución o Distribución de Frecuencias al conjunto de valores que toma una variable, adecuadamente
ordenados,- de mayor a menor o de menor a mayor -, y acompañado de sus frecuencias absolutas, es decir, de las
veces en las que aparece cada valor.
o 10 veces la cara 1,
o 15 veces la cara 2,
o 25 veces la cara 3,
o 30 veces la 4,
Diremos que la variable X (lanzamiento de un dado), toma k posibles valores (1, 2, 3, 4, 5, 6), de forma que el subíndice “i”
varía entre 1 y 6; los posibles valores que toma X (los xi) serán:
x1 = 1; x2 =2; x3 = 3; x4 = 4; x5 = 5; y x6= 6
El valor xi aparece ni veces, por ejemplo el valor x1, es decir, la cara 1 del dado, aparece n1 veces, es decir 10 veces y N, o
sea, el número total de unidades en las cuales efectuamos la medición, es 100.
Las distribuciones de frecuencias pueden ser unidimensionales, bidimensionales o multidimensionales, según observemos
una, dos o múltiples características de la población.
20.1.2. DEFINICIONES
La suma de todas las frecuencias absolutas, será de igual al número total (n) de eventos, fenómenos, objetos, individuos,
relaciones o elementos que componen el colectivo, población o universo o una muestra.
Por ejemplo, en clase hay gente de diversos países: 4 peruanos, 3 ingleses, 5 mejicanos y 6 españoles.
Es la relación por cociente, expresada en tanto por uno, entre la frecuencia absoluta (ni) de cada modalidad o categoría o
valor de la variable y el número total de elementos (n) Notación fi= ni/N
UK 3 3/18 = 0,17
TOTAL 18 1,00
Según observamos en el ejemplo anterior la frecuencia relativa tiene las siguientes características:
o Todas las frecuencias relativas serán iguales o mayores que 0 y menores que 1. Notación (0<fi<1)
• FRECUENCIA ACUMULADA
A la suma de las frecuencias absolutas hasta un determinado valor (xi) de la variable (x) se le denomina frecuencia absoluta
acumulada
• SERIES ESTADÍSTICAS
Vienen determinadas según se hayan realizado o tomado las observaciones, así se podrán distinguir:
Si el número de observaciones es elevado, pero los valores que puede tomar la variable (x) son reducidos, los datos se
disponen en dos columnas:
X1 N1
X2 N2
………. ……….
xk NK
o La Primera agrupa los valores (xi) en intervalos, debido al elevado número de observaciones. El número de
intervalos se obtiene de la raíz cuadrada del número de veces (n) que se han repetido los valores (xi)
Lo—1 N1
L1--L2 N2
………. ……….
LK-1--LK NK
Ejemplo 2: Una empresa tiene un total de 20 empleados que trabajan en cuatro oficinas. Las oficinas están numeradas del
1 al 4. Los registros de la empresa indican las oficinas en las que se ubican los 20 vendedores listados en orden alfabético
en la siguiente forma:
1 1
2 4
3 1
4 3
5 3
6 2
8 1
9 1
10 3
11 4
12 4
13 2
14 2
15 1
16 1
17 2
18 4
19 4
20 1
Respuesta:
Procedemos a contar las frecuencias con las que aparecen los empleados en cada una de las oficinas; por ejemplo, en la
oficina 1 contaremos 8 empleados (los enumerados en las posiciones 1, 3, 7, 8, 9 15, 16 y 20).
Nos quedaría, para una Frecuencia total o total de datos: N = 20, la siguiente tabla:
1 8 8
2 4 (8+ 4 =) 12
3 3 (12+ 3 =) 15
4 5 (15+ 5 =) 20
Para obtener las frecuencias relativas tenemos en cuenta que el número total de observaciones es 20, por lo que deben
dividirse las frecuencias absolutas por el número total de observaciones.
8 4 3 5
Frecuencia absoluta ( ni)
8 4 3 5
Frecuencia relativa ( ni /Ni ) = 0,4 = 0,2 = 0,15 = 0,25
20 20 20 20
La Frecuencia relativa también podemos expresarla en porcentajes: en la oficina 1 trabajan un 40 % de los empleados, en
la 2 un 20 %, en la 3 un 15 % y en la 4 el 25 % restante.
La Frecuencia relativa acumulada indica que en las 2 primeras oficinas trabajan conjuntamente un 60 % de empleados,
entre las 3 primeras oficinas agrupan un 75 %, etc.
Las distribuciones de frecuencias de una variable estadística pueden estudiarse a través de unas medidas, que se conocen
con el nombre genérico de estadísticos y que, analizadas conjuntamente, nos dan un panorama suficientemente sobre las
características de la distribución. Los estadísticos más habituales de una distribución de frecuencias se agrupan y resumen
en el siguiente esquema:
Medidas o Estadísticos
La media aritmética de una variable se define como la suma de todos los valores de la variable dividida por el número total
de observaciones; suele denotarse por x
i =n
x1 + x 2 + x 3 + x 4 + x 5 + ....... + x n
xi
i =1
x= = [3.2.1]
N N
i =n
El símbolo significa “Sumatorio”; la expresión x i , que utilizaremos habitualmente en este libro, se lee como “el
i =1
6 + 5 + 4 + 3 + 2 20
x= = =4
5 5
Con datos agrupados no se debe calcular si no se pueden construir intervalos o son de distinta amplitud o abiertos, es mejor
emplear la mediana.
En las distribuciones de tipo II o de tipo III es necesario utilizar las frecuencias para obtener la media aritmética simple; para
ello se emplea la siguiente formulación:
i =n
x n + x 2 n 2 + x 3 n 3 + ....... + x n n n x n
i =1
i i
x= 1 1 =
n1 + n 2 + n 3 + ....... + n n N
Que indica que cada valor ha sido “ponderado” o multiplicado por la frecuencia con la que aparece.
Obtener la media aritmética de las valoraciones de 0 a 10, otorgadas por 20 clientes a la percepción de la limpieza de unas
instalaciones; los valores otorgados por dichos clientes son:
4 3 3 5 2 3 0 2 1 5 6 7 8 1 6 7 4 6 4 3
Podríamos operar aplicando la expresión [3.2.1], pero también y dado que algunas de las valoraciones se repiten varias
veces, podemos agruparlas obteniendo una tabla de frecuencias de tipo II; esta agrupación es inevitable cuando disponemos
de un gran número de observaciones (imaginemos una encuesta sobre valoraciones realizada a 2000 clientes del hotel).
Construimos una tabla de frecuencias de tipo II, es decir, con frecuencias agrupadas, que quedaría de la siguiente forma:
0 1 0
1 2 2
2 2 4
3 4 12
4 3 12
5 2 10
6 3 18
7 2 14
8 1 8
9 0 0
10 0 0
Suma 20 80
i=n
En el caso de que los datos estén agrupados en clases, es decir, en las distribuciones denominadas de tipo III, se opera
igual que en los casos anteriores, tomando la marca de clase mi como xi.
Menos de 10.000 € 50
Suma 1000
En este caso tenemos dos intervalos (el primero y el último) que están abiertos y sólo podríamos aproximar la media
aritmética haciendo una hipótesis sobre la marca de clase de los dos intervalos abiertos, es decir del primero (menos de
10.000 € y del último (más de 100.000 €).
Así, por ejemplo, podríamos suponer que la media de los que ganan menos de 10.000 € es 5.000 € (media entre 0 y 10.000
€) y la media de los que ingresan “Más de 100.000 euros anuales” es 150.000 €.).
x n i
49000000
x= = = 49.000 €
N 1000
Si la variable (x) presenta valores extremos, la media aritmética puede ser poco representativa. Se consideran estadísticos
robustos, a aquéllos que no se ven afectados por los valores extremos.
Media aritmética ponderada (xp) se utiliza cuándo los valores (xi) de la variable (x), tienen distinta importancia en el estudio
de un colectivo o de una muestra y por ello, se les asigna un peso o coeficiente de ponderación (wi)
Es la raíz n-ésima del producto de cada uno de los valores (xi) de la variable (x), elevado a su frecuencia absoluta (ni).
Es la recíproca de la media aritmética del producto de los valores recíprocos (1/xi) de la variable(x) por su frecuencia absoluta
(ni).
Se suele emplear para promediar tipos de cambio, velocidades, productividades, tiempos, rendimientos, etc...
Ordenados los valores (xi) de la variable (x) en sentido creciente, la mediana (Me), es el valor (xi) del elemento central del
colectivo o de la muestra, es decir, aquél que deja a cada lado el mismo número de valores.
Es el valor de la variable que se corresponde con la frecuencia absoluta acumulada (ni) primera superior al número total
de datos dividido por dos(n/2).
Si el número de datos fuera par, la mediana (me) se correspondería con la media aritmética (xa) de los dos valores centrales.
En las distribuciones por intervalos, la mediana se calcula a partir del intervalo mediano (li-1-li), es decir, aquél
correspondiente a la primera frecuencia acumulada (ni) igual o mayor que el número total de datos dividido por 2 (n/2).
• MODA(mo)
Es el valor (xi) más repetido de la variable (x), el que se corresponde con la máxima frecuencia absoluta (ni) de la
distribución. En distribuciones por intervalos, se utilizan para su cálculo las marcas de clase y observando el intervalo
modal dónde ni/gi (altura del intervalo es mayor, se aplicará la siguiente fórmula:
Algunos autores proponen que, cuándo la amplitud de los intervalos es constante, se utilice la fórmula siguiente:
o Mo = li (real)+ gi. [(ni-ni-1) / 2ni - ni+1- ni-1] dónde ni es la frecuencia absoluta del intervalo modal y li-1 el límite
inferior real del intervalo modal. La moda así planteada, sería la media aritmética del límite superior del intervalo
anterior al modal y el límite inferior de éste. Cómo se verá más adelante, cuándo las curvas de distribución son
algo asimétricas xa-mo=3(xa-me).
Un promedio es representativo si los valores (xi) de la variable (x) están concentrados a su alrededor.
Si están muy dispersos, no lo será para poder determinar lo anterior, se suelen calcular otras medidas que relacionan los
valores (xi) de la variable con la media aritmética (xa) o a ésta con alguna de esas medidas previamente calculadas.
Es la media aritmética de las diferencias en valor absoluto, entre cada uno de los valores (xi) de la variable y la media
aritmética de los mismos.
dm = + [xi - xa].ni / n
• Varianza(sª)
Es la media aritmética de las diferencias entre los valores (xi) de la variable y su media aritmética (xa), elevadas al cuadrado.
Características:
o la varianza de una suma de variables es igual a la suma de las varianzas de las variables.
o si a todos los valores (xi) se les suma una constante (k), la varianza de la distribución no varía, pero si se les
multiplica por dicha constante, queda multiplicada la varianza (k.sª).
Todas estas medidas de dispersión son absolutas, porque están afectadas por la escala de medida de las respectivas
variables (euros, dólares, etc.), por eso es preciso introducir medidas abstractas, es decir, sin escala de medidas, que
permitan comparar los resultados, éstas son las relativas.
Son un cociente entre una dispersión absoluta y un promedio. Una de las más utilizadas es el coeficiente de variación de
Pearson (cvp), que permite comparar medias aritméticas de varias distribuciones.
Este coeficiente es el cociente entre la desviación típica (s) de la distribución y la media aritmética; va expresado en tanto
por ciento y es por tanto adimensional, lo que permite comparar distribuciones diferentes [cvp = (s / xa) .100]
No tiene sentido cuándo la media aritmética es igual a cero. Cuánto menor sea cvp, menor será la dispersión entorno a la
media aritmética (xa) y ésta será más representativa de los datos de partida; cuanto mayor sea cvp, menor representatividad
de la media (xa)
26 28 30 37 33 30 29 39 49 31
38 36 33 24 34 40 29 41 40 29
35 26 42 36 37 35 44 32 45 35
xi xi − x xi − M e xi xi − x xi − M e
24 10,76 11 35 0,24 0
26 8,76 9 36 1,24 1
26 8,76 9 36 1,24 1
28 6,76 7 37 2,24 2
29 5,76 6 38 3,24 3
29 5,76 6 39 4,24 4
30 4,76 5 40 5,24 5
30 4,76 5 40 5,24 5
31 3,76 4 41 6,24 6
32 2,76 3 42 7,24 7
33 1,76 2 44 9,24 9
33 1,76 2 45 10,24 10
34 0,76 1 49 14,24 14
35 0,24 0
n 30
1 1 145,48
Dx =
n
i =1
xi − x Dx =
30
i =1
xi − x =
30
= 4,84
n 30
1 1 145
Dm =
n
x
i =1
i − Me Dx =
30
x
i =1
i − Me =
30
= 4,83
n
( xi − x ) 2 ni
Para aplicar la fórmula de la varianza x2 = necesitamos obtener primero la columna ( xi − x) y luego la columna
i =1 N
( xi − x) 2
xi ( xi − x) ( xi − x) 2 xi ( xi − x) ( xi − x) 2
35 0,24 0,05
n
( xi − x ) 2 ni 1069,37
Por lo que
=
2
x = = 35,64
i =1 N 30
Una vez conocida la varianza, para calcular la desviación típica se trata simplemente de obtener la raíz cuadrada positiva
de este estadístico:
• CONCEPTO
En la práctica es muy frecuente que en el estudio de una población estemos interesados en medir no sólo una, sino varias
variables; cuando estudiamos dos variables de una población tenemos una distribución de frecuencias bidimensional,
sí estudiamos múltiples variables dispondremos de una distribución de frecuencias multidimensional.
Ejemplo, en la caracterización de la población que visita una determinada ciudad, podemos estar interesados en conocer la
nacionalidad y el nivel de renta de los visitantes (distribución bidimensional), pero también y además, el motivo de la visita,
la duración de la estancia, el medio de locomoción empleado para llegar a la ciudad, el gasto realizado en su estancia, la
distribución del gasto por conceptos, etc. (distribución multidimensional).
Centrándonos en las distribuciones bidimensionales, tendremos, para cada individuo observado los valores
correspondientes a dos variables o dos atributos, que denotamos por x e y.
La posibilidad de que la información observada se corresponda con un valor o con un atributo, nos da varios tipos de
distribuciones bidimensionales, a saber:
− Las dos informaciones son cualitativas (dos atributos, cada uno con sus diversas modalidades); medimos, por
ejemplo, la nacionalidad y el motivo de la visita.
− Una de las informaciones corresponde a una variable (datos cuantitativos discretos o continuos) y otra a un atributo;
− Las dos informaciones son cuantitativas (discretas o continuas); por ejemplo, el gasto realizado y la duración de la
estancia.
Se llama distribución conjunta de frecuencias de las dos variables (x, y) a la tabla que representa los valores observados
de ambas variables y las frecuencias relativas de aparición de cada una de las variables.
Cuando las variables son cuantitativas a las tablas de frecuencias se les denomina Tablas de Correlación y cuando se
trata de atributos o variables cualitativas se las denomina Tablas de Contingencia.
y1, y2 ....., ys Son los s valores o modalidades que toma la variable o atributo y.
ni1, ni2 ....., nis Es la frecuencia o número de veces en la que aparece el valor o modalidad i de la variable o atributo X
conjuntamente con los valores o modalidades 1, 2, .. s de la variable o atributo Y.
n1j, n2j ....., nij Es la frecuencia o número de veces en la que aparece el valor o modalidad j de la variable o atributo Y
conjuntamente con el valor o modalidad 1, 2, .. r de la variable o atributo X.
ni. Es la frecuencia total con la que aparece el valor o modalidad i de la variable o atributo X.
n.j Es la frecuencia total con la que aparece el valor o modalidad j de la variable o atributo Y.
Japoneses 50 5 2 0 57
yi Es el atributo modo de transporte que toma las modalidades y1 = Avión, y2 = Autobús ....., ys = Otros
modos de transporte.
n11, n12..., n1s Es la frecuencia en la que aparece el atributo 1 de la variable x (Alemán) conjuntamente con cada uno
de los atributos de y (n11 = 100 (100 alemanes llegan en Avión, n12 ....., n1s = 75 (75 alemanes llegan por
otros medios).
n11, n22..., n3j Es la frecuencia en la que aparece el atributo 1 de y (Avión) conjuntamente con los distintos atributos 1,
2, .. s de la variable X (n11 = 100 n21 = 300 nr1 = 70, de otras nacionalidades que vienen por avión).
ni. Es la frecuencia total con la que aparece la modalidad i de la variable x (n1. = 825, es decir que el número
total de alemanes que visitaron el hotel fue de 825).
n.j Es la frecuencia total con la que la modalidad j de la variable y (n.2 = 1330, indicativa de que el número
de clientes que llegó al hotel en autobús fue de 1330 personas).
nij
f ij =
n••
Como puede comprobarse, se verifica que la suma de todas las frecuencias relativas es igual a 1, es decir:
r s
f
i =1 j =1
ij =1
Las distribuciones de dos variables permiten obtener todos estadísticos similares a los indicados para las distribuciones de
una variable; obtener representaciones gráficas conjuntas y estimar los cambios que se producen en una variable cuando
se producen modificaciones en la otra variable.
Veamos un ejemplo muy simple para ver las posibilidades que ofrece el análisis estadístico:
El gráfico se construye de la siguiente forma, utilizando cualquier programa de gráficos o una hoja de cálculo.
230
210
190
170
Ventas
150
130
110
90
70
50
2.5 3 3.5 4 4.5
Gastos
Además de esta representación, podemos obtener una ecuación matemática que nos la relación las dos variables y nos
permita, por ejemplo, predecir las ventas de 2018 si el gasto en publicidad aumenta hasta 4,5 millones, por ejemplo.
A. COVARIANZA (Sxy)
Es la media aritmética de los productos de las diferencias entre los valores de (xi ; yj) de cada variable y la media aritmética
(xa ; ya) de los mismos.
Se utiliza para estudiar el grado de dependencia estadística o relación existente entre las variables x e y.
Cuando a cada valor (xi) de la variable x , le corresponde un único valor (yj) de la variable y; sí a cada valor (xi) de la variable
x no le corresponde un único valor (yj) de la variable y, se dirá que se existe una covariación estadística (nube de puntos).
La dependencia estadística (correlación), puede ser de tipo directo, de tipo inverso o inexistente (incorrelación), los dos
primeros tipos se producen si al crecer una de las variables, la otra también crece o decrece. Para conocer cómo se
comportan las variables, se recurre al ajuste de una línea a la nube de puntos.
se podría decir que es la sustitución de una covariación estadística por otra funcional o exacta a través de una función
matemática lineal, parabólica, exponencial, etc. , elegida por ser la que mejor se adapta a la observación de la
representación gráfica de la nube de puntos de los pares de puntos (xiyj).
Es uno de los métodos de ajuste más usuales se basa en la obtención de la función matemática que haga mínima la suma
de los cuadrados de las diferencias entre los valores (yj) observados, reales o empíricos y los valores ajustados o funcionales
(yo) , obtenidos a través de dicha función matemática.
Para hallar la función matemática, se toma la ecuación de la recta yo = a+bx , y se deriva respecto al parámetro “a” y se
iguala a cero y después se hace lo mismo con el parámetro “b” , obteniendo así un sistema de dos ecuaciones con dos
incógnitas “a” y “b” .
+ yj = a. n + b . +xi
yx i i = a xi + b xi2
A. CONCEPTO
Una serie cronológica es un conjunto de datos que recogen la evolución de los valores (yj) de la variable (y), a través de los
valores (ti) del período de tiempo analizado (t), normalmente los valores (ti) de la variable tiempo (t), suelen venir dados en
intervalos constantes.
B. USO
− Obtener los datos que faltan en alguna serie dada, a esto se le denomina interpolar prever valores (yj) futuros de
la variable y analizada, a esto se le denomina extrapolar valores aceptables.
Son la agrupación de los distintos factores o fuerzas que actúan sobre los valores (yj) de la variable, los cuatro grandes
componentes son: tendencia secular, variaciones estacionales, variaciones cíclicas y variaciones accidentales.
Es una variación lenta y regular que marca la dirección persistente de la serie observada en un período de tiempo amplio
(a veces se asimila a un promedio dentro de la tendencia a largo plazo), existen diversos procedimientos para determinar
la tendencia secular (elaborando la recta de los puntos medios una vez representada en coordenadas cartesianas, mediante
medias móviles, por un sistema de mínimos cuadrados que es similar a las ecuaciones explicadas en el ejemplo 9 anterior,
etc.
Son aquellos cambios en la tendencia normal, motivados por la influencia de determinados acontecimientos periódicos o
estacionales (cosechas, vacaciones, etc.)
Los procedimientos de cálculo suelen apoyarse en los denominados índices estacionales o cociente de las variaciones
porcentuales entre los datos periódicos (mensuales, trimestrales, etc.) y la media aritmética anual de los mismos, siendo
ésta del 100% y la suma anual de aquéllos de 1200.
• Variaciones Cíclicas
Son oscilaciones en los valores de la variable, que abarcan un período de tiempo largo (normalmente superior al año),
aunque no siempre de la misma amplitud. Así se oye hablar de los ciclos de las primas de seguros, el comportamiento
cíclico de la economía…
Para calcular los índices cíclicos basta con eliminar la tendencia (cuándo los datos son anuales), para eliminar la tendencia,
si se quieren hallar variaciones cíclicas anuales, se puede hacer por diferencia entre el dato y la tendencia.
Si lo que se quiere hallar son variaciones cíclicas relativas, se calculará el cociente entre el dato y la tendencia. Si los datos
son mensuales, se deben eliminar la tendencia y las variaciones estacionales. Así si se parte del modelo multiplicativo yj =
t .e. c .a., las variaciones cíclicas y accidentales c.a = yj / t.e.
• Variaciones Accidentales
Son movimientos esporádicos de corta duración, de sucesos ocasionales o accidentales (catástrofes naturales, elecciones,
etc.), que a veces son tan intensos que pueden originar una nueva tendencia o un nuevo ciclo.
• Demografía
La Demografía es la ciencia que tiene como objetivo el estudio de las poblaciones humanas y que trata de su dimensión,
estructura, evolución y características generales, considerados desde un punto de vista cuantitativo. Por tanto la Demografía
estudia estadísticamente la estructura y la dinámica de las poblaciones humanas y las leyes que rigen estos fenómenos.
• Tipos de Demografía:
Los dos tipos o partes de la Demografía están interrelacionados entre sí y la separación es un tanto artificial, puesto que el
objetivo de estudio es el mismo: las poblaciones humanas.
Demografía estática: Es la parte de la Demografía que estudia las poblaciones humanas en un momento de tiempo
determinado desde un punto de vista de dimensión, territorio, estructura y características estructurales.
La dimensión es el número de personas que residen normalmente en un territorio geográficamente bien delimitado.
El territorio es el lugar de residencia de las personas que puede globalizarse o desagregarse como puede ser una nación,
región, provincia, ciudad, municipio, etc.
Demografía dinámica: Es la parte de la Demografía que estudia las poblaciones humanas desde el punto de vista de la
evolución en el transcurso del tiempo y los mecanismos por los que se modifica la dimensión, estructura y distribución
geográfica de las poblaciones, como son la natalidad, mortalidad, emigración e inmigración.
• Fuentes de la Demografía:
1. Censos
El censo de población: es un conjunto de operaciones que reúnen, elaboran y publican datos demográficos, económicos y
sociales correspondientes a todos los habitantes de un país o territorio, referidos a un momento determinado o a ciertos
períodos dados.
Los censos son la principal Fuente de Datos Demográficos por la gran cantidad de información. Da una fotografía de la
población. Describe estadísticamente las poblaciones humanas consideradas desde un punto de vista estático. Es la fuente
primaria de las Estadísticas Básicas de Población que son necesarias para fines gubernamentales y aspectos de
planificación económica y social. Se usa para:
− comparabilidad internacional.
Requisitos:
− Territorio Definido: deben tener un área territorial definida con precisión. Implica una División Política-Administrativa
y todas aquellas herramientas de tipo cartográfico que aseguren una completa captación de información, sin
omisiones ni duplicaciones.
− Simultaneidad: para el recuento exacto de la población total, para relacionar los datos de la población con un
momento o período de tiempo bien definido. Generalmente se fija una fecha para el levantamiento censal y además
− Periodicidad: realización en intervalos regulares. Tiene gran importancia para determinar las tendencias
demográficas.
2. Pirámides de población
La pirámide de población es la representación gráfica de la distribución por edad y sexo de la población. Toma el nombre
de la forma que debe adoptar en las sociedades con una población equilibrada, con una amplia base debido al gran número
de nacimientos que se estrecha paulatinamente por la mortalidad creciente a medida que aumenta el intervalo de edades
considerado.
La Pirámide de Edades es un medio de representación gráfica que permite estudiar la estructura por edad y sexo de una
población. Revelan una gran cantidad de información sobre patrones históricos de natalidad y mortalidad de varias
generaciones. Al presentar el número absoluto o el porcentaje de varones y mujeres en cada edad o grupo de edad, da una
idea clara de las características de una población.
Presentan una base ancha y un angostamiento progresivo y regular hasta la cúspide de la pirámide. En general y
normalmente caracteriza a los países con fuerte natalidad y mortalidad media o fuerte. Implica poblaciones jóvenes.
Presentan un angostamiento pronunciado en la base, con un menor número de personas en las edades menores,
evidenciando que las cohortes o generaciones recientes han sido progresivamente menos numerosas que las anteriores,
lo que ha hecho que la estructura de edades cambie de "expansiva" a "constrictiva. En general y normalmente, caracteriza
a los países con natalidad decreciente y mortalidad estable. Implica poblaciones en transición a envejecida.
Presentan un similar número de personas aproximadamente en todos los grupos de edad con una reducción paulatina en
las edades más avanzadas. En general y normalmente, caracteriza a países con valores en natalidad igual a los valores en
mortalidad. Implica poblaciones envejecidas.
La pirámide de cada país permite ver los efectos de los principales acontecimientos ocurridos en el transcurso de varias
generaciones.
Por ejemplo, los de las dos Guerras Mundiales, donde se notan claramente las grandes pérdidas en hombres en la II Guerra
Mundial, epidemias, migraciones y “baby booms”. Además se puede observar el predominio de un sexo en las edades
menores y mayores como resultado de patrones de natalidad y la mortalidad diferencial, entre otros.
Hay tres combinaciones posibles en las relaciones entre la variable “nacimientos y defunciones”:
• TABLAS DE MORTALIDAD:
Una tabla de mortalidad nos informa de cómo evoluciona la mortalidad de un colectivo dado de personas a lo largo del
tiempo hasta su extinción.
La tabla presenta dos primeras columnas, la primera con edades expresadas en años enteros y en la segunda con el número
de personas que sobreviven a esa edad. Hay que señalar que:
o El colectivo es cerrado, es decir, el colectivo inicial no tiene incorporaciones y solo sufre bajas.
Veamos algunos valores, entre 40 y 50 años de edad, de una tabla de mortalidad, en este caso la tabla GRM-95, tabla
mortalidad masculina de experiencia suiza, que se recoge en su totalidad en el ANEXO-I
x lx dx qx qx*1000
En la primera columna, x, se representan las edades en años enteros (si el colectivo es de mujeres la letra es y).
En la segunda columna, lx, aparecen los sobrevivientes a cada edad, por lo que quizás fuese más correcto hablar de tabla
de sobrevivencia.
La tabla comienza en la edad 0 con un millón de individuos, lo que se denomina radix de la tabla. Es decir, de un colectivo
de 1.000.000 de individuos, en el momento del nacimiento, alcanzan la edad de 40 años un total de 948.168, la de 41 años
946.403, la de 42 años 944.520… etc. Los valores están referidos al momento inicial de cada edad.
Conocidos los valores de los sobrevivientes es fácil deducir los fallecimientos que se producen en un año, es decir, el
número de personas de una edad x que no alcanzan la edad x+1.
De un colectivo de 948.168 de individuos de edad 40 años, no alcanzan un año más de edad 1.765, diferencia entre 948.168
y 946.403, o lo que es lo mismo 1.765 fallecen en el transcurso de un año. De 946.403 individuos de edad 41 año, no
alcanzan un año más de edad 1.883, diferencia entre 946.403 y 944.520, o lo que es lo mismo 1.883 fallecen en el transcurso
de un año. Y así sucesivamente.
Conocido el dato de los sobrevivientes a una edad y el número de ellos que no alcanzan a vivir un año más, o lo que es lo
mismo, el número de los fallecidos en el transcurso del siguiente año, podemos deducir cual es la probabilidad de
fallecimiento de una persona de edad x en el transcurso del año siguiente.
Para ello se divide el número de personas de esa edad que fallecen a lo largo de un año entre el número de personas de
esa edad que estaban vivas al inicio de ese año, valor que se designa como qx.
Es decir, para un individuo de 40 años de edad, por ejemplo, la probabilidad de fallecer a lo largo del año siguiente viene
dada por el cociente entre los que fallecen en el transcurso del año siguiente, 1.765, y los que vivían al inicio de esa
anualidad, 948.168: 1.765/948.168 = 0,0018615 lo que quiere decir que “la probabilidad de que un individuo de 40 años
fallezca en el transcurso del año siguiente es del 0,0018615”. Esta magnitud es muy común multiplicarla por 1.000, valor
Puede resultar chocante que fallezca un número de individuos no entero, lo que obviamente no es posible ya que no fallecen
partes de individuo, pero la probabilidad es un valor que deriva de un cociente, casos favorables divididos por los casos
posibles, y se nos darán valores no enteros.
− La probabilidad de supervivencia
o Queremos saber cuál es la probabilidad de que un individuo de 40 años de edad viva un año más, es decir,
que siga vivo a los 41 años de edad.
o La tabla nos informa de que a los 40 años viven 948.168 y de esos alcanzan los 41 años son 946.403.
o Que expresada en por mil sería: de cada mil individuos de edad de 40 años viven un año más 988,1385.
Los valores: lx, dx y qx referidos a una edad x, son los que aparecen normalmente en una tabla de mortalidad. A partir de
ellos es posible calcular cualquier otra probabilidad, la probabilidad de fallecer en los próximos cinco años, por ejemplo, la
probabilidad de que un individuo de 40 años fallezca antes de cumplir los 45, para lo cual:
o Por tanto, conocemos los que fallecen en el transcurso de esos cinco años: 948.168-940.337=7.831.
o lo que es lo mismo: de cada mil individuos de 40 años de edad 8,2591 fallecen en el transcurso de los cinco
años siguientes.
Lo anterior son ejemplos que tratan de dar una idea de cómo se trabaja con una tabla de mortalidad para calcular las
probabilidades de fallecimiento y supervivencia ya que las probabilidades son los datos realmente importantes que
proporcionan las tablas.
• LA PROBABILIDAD:
La probabilidad de un suceso es siempre positiva y se da siempre entre dos valores: 0 y 1. La probabilidad cero es la
probabilidad de que un suceso seguro no se va a dar y la probabilidad 1 será la del suceso que seguro que sí se va a dar.
Cuanto más cerca esté la probabilidad de cero el suceso será menos probable que se dé y cuanto más se vaya acercando
a 1 se dará más ciertamente.
Si tomamos las probabilidades que hemos obtenido para el ejemplo de un individuo de 40 años, que han sido
Lo que es lógico ya que es cierto que el individuo morirá o sobrevivirá, y no hay otras alternativas, por lo que la probabilidad
de esa certeza, o vive o muere, se mide con probabilidad 1.
Hay que señalar que al hablar de probabilidad estamos hablando de grandes números y dentro de un contexto de grandes
números tiene sentido hablar de probabilidades.
Si tenemos un grupo de 10 personas de 40 años será complicado observar si se cumple la tabla: si fallece una persona la
mortalidad será del 0,1 (del 100 por 1.000) y si no fallece nadie será de 0, pero es imposible que en un año fallezcan
0,0018165.
Se observa que cuanto mayor es el colectivo, los valores teóricos y reales de los fallecimientos que se deducen de los
valores de las probabilidades de la tabla, se aproximan más. Si el colectivo es muy pequeño las desviaciones son muy
grandes por eso, insistimos, cuando se habla de probabilidades se habla en relación a grandes números.
• EL TIPO DE INTERÉS:
Como vimos en su momento, otro elemento esencial en el cálculo de la prima en un seguro de vida es el tipo de interés,
principalmente en los seguros de supervivencia.
Veamos otro sencillo ejemplo: una persona, varón de 45 años, desea que al cabo de un año se le paguen 1.000 euros para
ello se dirige primero a un banco y después a una compañía de seguros. (Imaginemos un tipo vigente en el mercado del
7% anual)
− Operación bancaria: para darle 1.000 euros al cabo de un año el banco le pedirá una cantidad tal que más el 7%
de 1.000 euros al cabo de un año: 934,58 euros (0,07*934,58 = 65,42, 934,58+65,42 = 1.000).
Irá a la tabla para ver su probabilidad de supervivencia: l45 = 937.999 y l46 = 935.468, por lo que la probabilidad
de que un varón de 45 años viva un año más es: 935.468/937.999 = 997,30 por mil. Es decir, de cada 1.000 de
45 años viven un año más 997,30.
A la vista de lo anterior el asegurador pedirá una cantidad tal que más el 7% de 997,30 euros: 932,06 euros
(0,07*932,06 = 65,24, 932,06 + 65,24 = 997,30)
Y así se pone de manifiesto la diferencia entre la operación puramente financiera y la operación aseguradora:
o En la operación financiera sólo se considera el tipo de interés y el banco sabe que, pasado un año, tendrá
que pagar 1.000 euros, a quien contrató la operación o a su herederos, si fallece.
Si la tabla no se cumple exactamente y viven más: el asegurador perderá dinero, porque deberá pagar más de lo previsto.
Si la tabla no se cumple exactamente y viven menos: el asegurador ganará dinero, porque deberá pagar menos de lo
previsto.