0% encontró este documento útil (0 votos)
164 vistas66 páginas

Tema 20. Calculo Estadistico

Este documento presenta el tema 20 sobre cálculo estadístico. Explica conceptos básicos como población, muestra, datos, variables y atributos. Luego describe medidas estadísticas como mediana, moda y media para analizar distribuciones de frecuencias. También cubre estadísticas bivariadas, medidas de dependencia y series temporales. El objetivo es proporcionar las nociones fundamentales de cálculo estadístico necesarias para el análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
164 vistas66 páginas

Tema 20. Calculo Estadistico

Este documento presenta el tema 20 sobre cálculo estadístico. Explica conceptos básicos como población, muestra, datos, variables y atributos. Luego describe medidas estadísticas como mediana, moda y media para analizar distribuciones de frecuencias. También cubre estadísticas bivariadas, medidas de dependencia y series temporales. El objetivo es proporcionar las nociones fundamentales de cálculo estadístico necesarias para el análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CURSO SUPERIOR DE SEGUROS

TEMA 20: CÁLCULO ESTADÍSTICO


Material Registrado en el Registro de la Propiedad Intelectual
Madrid
Nº de Expediente: 09-RTPI-07844.2/2015
Referencia documental: 09/086873.4/15

Esta obra científica ha sido creada por los autores con carácter docente y su contenido ha sido inscrito
y registrado en el Registro Territorial de la Propiedad Intelectual de Madrid con Nº de Solicitud y con Nº
de Referencia arriba indicados, otorgando al presente documento y a su autor los derechos recogidos
en Ley de Propiedad Intelectual (Texto Refundido aprobado por Real Decreto Legislativo 1/1996, de 12
de abril)

A tal efecto, queda prohibido el plagio o copia del mismo según la Ley de propiedad intelectual y artística
vigente. Asimismo queda totalmente prohibida la reproducción total o parcial de cualquiera de sus
apartados en cualquier soporte mecánico o digital sin el consentimiento por escrito del propietario y sin
hacer mención a la fuente y al autor.

En caso contrario, se incurrirá en un delito tipificado en los Artículos 270, 271 y 272 del Código Penal
(Ley Orgánica 10/1995, de 23 de noviembre, del Código Penal -Última modificación del 28 de abril de
2015) sobre los Delitos relativos a la Propiedad Intelectual e Industrial, al Mercado y a los Consumidores
y podrá por tanto ser perseguido por ello.

Tema 20: Cálculo estadístico


Autores:

Ángel Muñoz Alamillos, Doctor en Ciencias Económicas y Empresariales por


la Universidad Autónoma de Madrid. Profesor Titular de Universidad.

Jorge Campos Moral, Licenciado en Derecho y Master en Asesoría Jurídica


y Fiscal de Empresas. Corredor de Seguros. Presidente de la Asociación de
los Nuevos Corredores y Corredurías de Seguros - NEWCORRED. Asesor
Financiero Internacional Certificado por el SII de Londres.

Javier Navas Oloriz, Licenciado en Económicas, Actuario en Seguros por


la Universidad Complutense de Madrid. Auditor de cuentas y Corredor
de Seguros.

Rafael Isidro Aparicio, Licenciado en Ciencias Económicas y


Empresariales por la Universidad Autónoma de Madrid. Corredor de Seguros.

César Muñoz Martínez, Licenciado en Derecho y en Económicas por


la Universidad Carlos III de Madrid. Doctor en la Unión Europea
(Economía y Derecho) por la UNED. Mediador de Seguros (Grupo A). Master
en Mercados Bursátiles y Derivados Financieros por la UNED.

Tema 20: Cálculo estadístico


CURSO SUPERIOR DE SEGUROS

ÍNDICE DE CONTENIDOS

TEMA 20. CALCULO ESTADÍSTICO.................................................................................................................................................... 5

20.1. NOCIONES DE CÁLCULO ESTADÍSTICO ................................................................................................................................................................... 5

20.1.1. CÁLCULO ESTADÍSTICO: CONCEPTO Y MEDIDAS ............................................................................................................................................ 5

20.1.2. DEFINICIONES .......................................................................................................................................................................................................... 10

20.1.3. MEDIDAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS ................................................................................................................................. 19

20.1.4. ESTADÍSTICAS DE DOS VARIABLES ................................................................................................................................................................ 39

20.1.5. MEDIDAS DE DEPENDENCIA ESTADÍSTICA ................................................................................................................................................... 48

20.1.6. SERIES CRONOLÓGICAS O TEMPORALES: COMPONENTES ................................................................................................................... 50

20.2. TEORÍA DE LA POBLACIÓN Y ANÁLISIS DEMOGRÁFICO ................................................................................................................................. 53


TEMA 20. CALCULO ESTADÍSTICO

20.1. NOCIONES DE CÁLCULO ESTADÍSTICO

20.1.1. CÁLCULO ESTADÍSTICO: CONCEPTO Y MEDIDAS

La Estadística suele definirse como la ciencia que tiene por objeto recoger de forma agrupada la información que se produce
de fenómenos repetitivos o no ocasionales.

En su origen la Estadística se desarrolló en la economía y en la política, de hecho hasta bien entrado el siglo XIX la
"Estadística" se utilizaba para hacer mención a informaciones de tipo socioeconómico sobre la realidad de un Estado
(establecimiento de registros de población, nacimientos, defunciones, etc.; censos de edificios y de elementos de riqueza,
etc.)

Hoy, la Estadística no queda reservada al estudio del Estado sino que es algo más amplio y útil en múltiples ciencias y áreas
del conocimiento humano.

Actualmente, en su definición más común se le reconoce como "la ciencia que se ocupa de la obtención de información y
que proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre" o "La rama del
método científico que se ocupa de los datos obtenidos contando o midiendo las propiedades de determinados colectivos”;
a estos colectivos, se le denomina en Estadística “Poblaciones”.

Tema 20: Cálculo estadístico 5


Las poblaciones son cualquier colección de datos numéricos obtenidos de observaciones de eventos (sucesos), fenómenos,
personas, elementos o cosas ordenados y clasificados según un criterio determinado. Ejemplo: estadísticas de producción,
demográficas, Cotizaciones, etc.

La Estadística suele dividirse en dos grandes apartados: La Estadística Descriptiva, que recoge un conjunto de técnicas
y procedimientos para organizar, resumir y tratar sistemáticamente datos disponibles de sucesos ya acaecidos y La
Estadística Inferencial o Inferencia Estadística, que, basada en la teoría matemática de la Probabilidad, estudia los
métodos empleados para inferir algo acerca de una población basándose en la información aportada por una parte del
colectivo (muestra).

Los conceptos estadísticos fundamentales son:

− Colectivo, Población o Universo: Es un conjunto de eventos, fenómenos, individuos, elementos o cosas.

− Muestra: Es una parte de un colectivo, población o universo, que se va a estudiar para ver si es representativa del
mismo.

− Datos: Son los caracteres o características (hechos, fenómenos, objetos, etc.), de un colectivo o de una muestra,
susceptibles o no de ser medidos. Suelen ser dispersos y no tienen un único valor o atributo constante, y no nos
dicen nada salvo si los ordenamos o clasificamos para apreciar cómo están distribuidos, apoyándonos en tablas
de frecuencia.

Tipos de Datos (se suelen dividir en dos grupos):

Tema 20: Cálculo estadístico 6


o Variables

o Atributos

VARIABLES

Son los caracteres o características que pueden tomar un valor cualquiera dentro de un conjunto determinado de ellos
(dominio de la variable), observados cuantitativamente mediante una medida y/o escala de medidas.

o Si solo puede tomar un valor, en este caso se denominará constante.

o Si puede tomar cualquier valor entre dos valores dados se llamará variable continua (por ejemplo: la altura,
el peso de las personas, etc.…)

o Si entre dos valores dados consecutivos no puede tomar otro, se llamará variable discreta (por ejemplo:
número de hijos, árboles, etc.). Se suele designar con las últimas letras del abecedario en mayúsculas y los
valores que pueden tomar en minúsculas afectadas por un subíndice. (por ejemplo variable valores
x1,x2,x3,…..xn, a la diferencia entre el mayor y menor valor de la variable, se le llama rango o recorrido de
la variable)

ATRIBUTOS

Son los caracteres o características no susceptibles de ser medidos (ejemplo: sexo, religión, grupo sanguíneo, etc.…)

Tema 20: Cálculo estadístico 7


Toman distintas modalidades o categorías observadas cualitativamente (nominales y ordinales).

Se suelen designar por las primeras letras del abecedario en mayúsculas y las modalidades o categorías que pueden tomar
en minúsculas. (Por ejemplo: Atributos/Modalidades/Categorías)

A: Sexo: a1 Masculina, a2 Femenino

B: Color Pelo: b1 Rubio b2 Castaño b3 Moreno

Las Modalidades o categorías deben cumplir unos requisitos:

o Estar bien definidas.

o Dentro de un atributo sólo se puede pertenecer a una de las modalidades o categorías.

o Todos los datos deben estar clasificados entre las diferentes categorías de un atributo.

MEDIDAS

Medir es aplicar un número (símbolo) a un evento, fenómeno, objeto, individuos, o relación, facilitando su comparación de
forma directa o indirecta (ya que las características humanas, hechos sociales, etc. no son medibles en sí mismas.

Tema 20: Cálculo estadístico 8


DISTRIBUCIÓN DE FRECUENCIAS

Se denomina Distribución o Distribución de Frecuencias al conjunto de valores que toma una variable, adecuadamente
ordenados,- de mayor a menor o de menor a mayor -, y acompañado de sus frecuencias absolutas, es decir, de las
veces en las que aparece cada valor.

En la notación más habitual que emplearemos a continuación designaremos por:

o X (mayúscula) -> La variable o característica objeto de estudio.


o xi (minúscula) -> El valor que toma la variable o característica X en el individuo i.
o k -> El número de valores distintos que toma una variable.
o ni -> El número de veces o frecuencia con la que aparece un determinado valor xi.
o N -> El número de unidades en las cuales efectuamos la medición o disponemos de datos.

Ejemplo 1: Se tira un dado 100 veces y se obtienen

o 10 veces la cara 1,
o 15 veces la cara 2,
o 25 veces la cara 3,
o 30 veces la 4,

Tema 20: Cálculo estadístico 9


o 15 veces la cara 5 y
o 5 veces la cara 6.

Diremos que la variable X (lanzamiento de un dado), toma k posibles valores (1, 2, 3, 4, 5, 6), de forma que el subíndice “i”
varía entre 1 y 6; los posibles valores que toma X (los xi) serán:

x1 = 1; x2 =2; x3 = 3; x4 = 4; x5 = 5; y x6= 6

El valor xi aparece ni veces, por ejemplo el valor x1, es decir, la cara 1 del dado, aparece n1 veces, es decir 10 veces y N, o
sea, el número total de unidades en las cuales efectuamos la medición, es 100.

Las distribuciones de frecuencias pueden ser unidimensionales, bidimensionales o multidimensionales, según observemos
una, dos o múltiples características de la población.

20.1.2. DEFINICIONES

En una distribución de frecuencias unidimensional se definen los siguientes conceptos elementales:

• FRECUENCIA ABSOLUTA (ni)

Es el número de veces que aparece o se repite:

Tema 20: Cálculo estadístico 10


o Un valor determinado (xi) de la variable “x” ó

o Una modalidad o categoría (ai) de un atributo “A”

La suma de todas las frecuencias absolutas, será de igual al número total (n) de eventos, fenómenos, objetos, individuos,
relaciones o elementos que componen el colectivo, población o universo o una muestra.

Por ejemplo, en clase hay gente de diversos países: 4 peruanos, 3 ingleses, 5 mejicanos y 6 españoles.

− ATRIBUTO: País (Perú/UK./México/España)


− Frecuencia Absoluta (ni): 4/3/5/6

• FRECUENCIA RELATIVA (fi)

Es la relación por cociente, expresada en tanto por uno, entre la frecuencia absoluta (ni) de cada modalidad o categoría o
valor de la variable y el número total de elementos (n) Notación fi= ni/N

PAÍS (ATRIBUTO) Fr Absoluta (ni) [Link] (fi)

PERÚ 4 4/18 = 0,22

UK 3 3/18 = 0,17

MÉXICO 5 5/18 =0,28

Tema 20: Cálculo estadístico 11


ESPAÑA 6 6/18 =0,33

TOTAL 18 1,00

Según observamos en el ejemplo anterior la frecuencia relativa tiene las siguientes características:

o Todas las frecuencias relativas serán iguales o mayores que 0 y menores que 1. Notación (0<fi<1)

o La suma de todas las frecuencias relativas (fi) será igual a 1

• FRECUENCIA ACUMULADA

A la suma de las frecuencias absolutas hasta un determinado valor (xi) de la variable (x) se le denomina frecuencia absoluta
acumulada

• SERIES ESTADÍSTICAS

Vienen determinadas según se hayan realizado o tomado las observaciones, así se podrán distinguir:

− Temporales: Observaciones tomadas en un momento Fijo. Si estudian la repetición de ciertos sucesos, se


denominarán de Frecuencias, si se centran en atributos serán cualitativas (nominales u ordinales), si se centran
en variables serán cuantitativas (discretas o continuas).

Tema 20: Cálculo estadístico 12


− Temporales ó Cronológicas: Cuando las observaciones de los valores se han realizado en el tiempo. Para
manejar más cómodamente los datos, se suelen agrupar en tablas de frecuencias similares a las que se recogen
en los ejemplos vistos. Las distribuciones de frecuencias, son el conjunto de valores (xi) que toma una variable (x)
junto con sus frecuencias. Suelen estar referidas a una o dos variables, si bien a veces se utiliza el análisis
multivariante.

Si se centra el estudio en distribuciones de una sola variable, se distinguirán:

Si el número de observaciones es elevado, pero los valores que puede tomar la variable (x) son reducidos, los datos se
disponen en dos columnas:

VALORES VARIABLES (xi) FRECUENCIAS ABSOLUTAS (ni)

X1 N1

X2 N2

………. ……….

xk NK

Si se centra el estudio en distribuciones de una sola variable, se distinguirán:

Tema 20: Cálculo estadístico 13


o Si el número de observaciones es elevado y los valores (xi) que puede tomar la variable (x) son muchos, se
agruparán los datos en dos columnas.

o La Primera agrupa los valores (xi) en intervalos, debido al elevado número de observaciones. El número de
intervalos se obtiene de la raíz cuadrada del número de veces (n) que se han repetido los valores (xi)

o La amplitud (gi)= rango/número de intervalos.

INTERVALOS DE VALOR (Li-1-Li) FRECUENCIAS ABSOLUTAS (ni)

Lo—1 N1

L1--L2 N2

………. ……….

LK-1--LK NK

Tema 20: Cálculo estadístico 14


Los intervalos de valores se forman por la agrupación de los valores de la variable y pueden ser de amplitud fija (g) o variable
(Diferencia entre los valores extremos de cada intervalo). Cuanto más pequeña sea la amplitud, menor será la pérdida de
información, tratando al mismo tiempo que no se creen demasiados intervalos. Para efectuar los cálculos se determinará
un valor representativo de todos los puntos del intervalo denominado Marca de Clase (Valor Medio del Intervalo xi = Li-
1+Li/2)

El número de valores distintos de la variable es inferior al total de las observaciones.

Ejemplo 2: Una empresa tiene un total de 20 empleados que trabajan en cuatro oficinas. Las oficinas están numeradas del
1 al 4. Los registros de la empresa indican las oficinas en las que se ubican los 20 vendedores listados en orden alfabético
en la siguiente forma:

Vendedor Número de Oficina

1 1

2 4

3 1

4 3

5 3

6 2

Tema 20: Cálculo estadístico 15


7 1

8 1

9 1

10 3

11 4

12 4

13 2

14 2

15 1

16 1

17 2

18 4

19 4

20 1

Tema 20: Cálculo estadístico 16


Sintetice los datos y muestre, en una tabla, las frecuencias asociadas con los valores 1, 2, 3 y 4.

Respuesta:

Procedemos a contar las frecuencias con las que aparecen los empleados en cada una de las oficinas; por ejemplo, en la
oficina 1 contaremos 8 empleados (los enumerados en las posiciones 1, 3, 7, 8, 9 15, 16 y 20).

Nos quedaría, para una Frecuencia total o total de datos: N = 20, la siguiente tabla:

Variable (xi) Frecuencia absoluta (ni) Frecuencia acumulada


(Ni)
(oficinas) (número de empleados)

1 8 8

2 4 (8+ 4 =) 12

3 3 (12+ 3 =) 15

4 5 (15+ 5 =) 20

Para obtener las frecuencias relativas tenemos en cuenta que el número total de observaciones es 20, por lo que deben
dividirse las frecuencias absolutas por el número total de observaciones.

Tema 20: Cálculo estadístico 17


1 2 3 4
Variable (Xi)

8 4 3 5
Frecuencia absoluta ( ni)

8 4 3 5
Frecuencia relativa ( ni /Ni ) = 0,4 = 0,2 = 0,15 = 0,25
20 20 20 20

0,40 0,60 0,75 1


Frecuencia relativa
acumulada

La Frecuencia relativa también podemos expresarla en porcentajes: en la oficina 1 trabajan un 40 % de los empleados, en
la 2 un 20 %, en la 3 un 15 % y en la 4 el 25 % restante.

La Frecuencia relativa acumulada indica que en las 2 primeras oficinas trabajan conjuntamente un 60 % de empleados,
entre las 3 primeras oficinas agrupan un 75 %, etc.

Tema 20: Cálculo estadístico 18


20.1.3. MEDIDAS DE UNA DISTRIBUCIÓN DE FRECUENCIAS

Las distribuciones de frecuencias de una variable estadística pueden estudiarse a través de unas medidas, que se conocen
con el nombre genérico de estadísticos y que, analizadas conjuntamente, nos dan un panorama suficientemente sobre las
características de la distribución. Los estadísticos más habituales de una distribución de frecuencias se agrupan y resumen
en el siguiente esquema:

Medidas o Estadísticos

Medidas de Posición Medidas de Dispersión Medidas de Concentración Medidas de Forma

Media Aritmética, Media


Geométrica, Media Armónica, Índice de Gini Medidas de Asimetría y
Absolutas Relativas
Mediana, Moda y Cuantiles Curva de Lorenz Medidas de Curtosis

Rango, recorrido Coeficiente de apertura,


intercuartílico, desviación recorrido relativo, recorrido
absoluta media, varianza, semi-intercuartílico,
desviación típica coeficiente de variación

Tema 20: Cálculo estadístico 19


MEDIDAS DE POSICIÓN, TENDENCIA CENTRAL O PROMEDIOS.

El fin es encontrar valores numéricos que caractericen la distribución de las frecuencias.

• MEDIA ARITMÉTICA (xa)

La media aritmética de una variable se define como la suma de todos los valores de la variable dividida por el número total
de observaciones; suele denotarse por x

i =n

x1 + x 2 + x 3 + x 4 + x 5 + ....... + x n 
xi
i =1
x= = [3.2.1]
N N

i =n
El símbolo  significa “Sumatorio”; la expresión x i , que utilizaremos habitualmente en este libro, se lee como “el
i =1

sumatorio de todos los valores de x desde el primero (i = 1) hasta el último (i = n)”.

Tema 20: Cálculo estadístico 20


Ejemplo 3: Los años de antigüedad en una empresa de 5 trabajadores son 6, 5, 4, 3, 2; Obtener la media aritmética simple
de estas valoraciones.

Aplicando la expresión [3.2.1], el estadístico pedido será:

6 + 5 + 4 + 3 + 2 20
x= = =4
5 5

Con datos agrupados no se debe calcular si no se pueden construir intervalos o son de distinta amplitud o abiertos, es mejor
emplear la mediana.

En las distribuciones de tipo II o de tipo III es necesario utilizar las frecuencias para obtener la media aritmética simple; para
ello se emplea la siguiente formulación:

i =n

x n + x 2 n 2 + x 3 n 3 + ....... + x n n n x n
i =1
i i
x= 1 1 =
n1 + n 2 + n 3 + ....... + n n N

Que indica que cada valor ha sido “ponderado” o multiplicado por la frecuencia con la que aparece.

Tema 20: Cálculo estadístico 21


Ejemplo 4:

Obtener la media aritmética de las valoraciones de 0 a 10, otorgadas por 20 clientes a la percepción de la limpieza de unas
instalaciones; los valores otorgados por dichos clientes son:

4 3 3 5 2 3 0 2 1 5 6 7 8 1 6 7 4 6 4 3

Podríamos operar aplicando la expresión [3.2.1], pero también y dado que algunas de las valoraciones se repiten varias
veces, podemos agruparlas obteniendo una tabla de frecuencias de tipo II; esta agrupación es inevitable cuando disponemos
de un gran número de observaciones (imaginemos una encuesta sobre valoraciones realizada a 2000 clientes del hotel).

Construimos una tabla de frecuencias de tipo II, es decir, con frecuencias agrupadas, que quedaría de la siguiente forma:

Tema 20: Cálculo estadístico 22


xi ni xi ni

0 1 0

1 2 2

2 2 4

3 4 12

4 3 12

5 2 10

6 3 18

7 2 14

8 1 8

9 0 0

10 0 0

Suma 20 80

Tema 20: Cálculo estadístico 23


Aplicando la expresión [3.2.2] tendremos:

i=n

x 1n1 + x 2 n 2 + x 3n 3 + ....... + x nnn


∑ x ini
i=1 80
x= = = =4
n1 + n 2 + n 3 + ....... + nn N 20

En el caso de que los datos estén agrupados en clases, es decir, en las distribuciones denominadas de tipo III, se opera
igual que en los casos anteriores, tomando la marca de clase mi como xi.

Tema 20: Cálculo estadístico 24


Ejemplo 5. Mediante una encuesta efectuada a 1.000 compradores de un determinado seguro, se ha obtenido que su renta
anual, en euros, es la siguiente:

Renta anual de los clientes en ni


euros

Menos de 10.000 € 50

De 10.001 a 21.000 € 100

De 21.001 a 50.000 € 600

De 50.001 a 100.000 € 150

Más de 100.000 € 100

Suma 1000

Tema 20: Cálculo estadístico 25


Con esta información, calcúlese la media aritmética muestral.

En este caso tenemos dos intervalos (el primero y el último) que están abiertos y sólo podríamos aproximar la media
aritmética haciendo una hipótesis sobre la marca de clase de los dos intervalos abiertos, es decir del primero (menos de
10.000 € y del último (más de 100.000 €).

Así, por ejemplo, podríamos suponer que la media de los que ganan menos de 10.000 € es 5.000 € (media entre 0 y 10.000
€) y la media de los que ingresan “Más de 100.000 euros anuales” es 150.000 €.).

Con esta hipótesis construimos la marca de clase xi en la siguiente forma:

Tema 20: Cálculo estadístico 26


Renta anual de los clientes en ni mi = xi xi ni
euros

Menos de 10.000 € 50 5000 250000

De 10.001 a 21.000 € 100 15000 1500000

De 21.001 a 50.000 € 600 35000 21000000

De 50.001 a 100.000 € 150 75000 11250000

Más de 100.000 € 100 150000 15000000

Suma 1000 49000000

Operando con la expresión [3.2.2] tendremos:

x n i
49000000
x= = = 49.000 €
N 1000

Tema 20: Cálculo estadístico 27


Que nos da una media aritmética de 49.000 € de renta.

Si la variable (x) presenta valores extremos, la media aritmética puede ser poco representativa. Se consideran estadísticos
robustos, a aquéllos que no se ven afectados por los valores extremos.

Media aritmética ponderada (xp) se utiliza cuándo los valores (xi) de la variable (x), tienen distinta importancia en el estudio
de un colectivo o de una muestra y por ello, se les asigna un peso o coeficiente de ponderación (wi)

• MEDIA GEOMÉTRICA (g)

Es la raíz n-ésima del producto de cada uno de los valores (xi) de la variable (x), elevado a su frecuencia absoluta (ni).

Es mejor que la media aritmética para promediar porcentajes o proporciones.

No es representativa si se dan simultáneamente valores positivos y negativos en un colectivo o en una muestra.

• MEDIA ARMÓNICA(H) H = N/+1/xi .ni

Es la recíproca de la media aritmética del producto de los valores recíprocos (1/xi) de la variable(x) por su frecuencia absoluta
(ni).

Se suele emplear para promediar tipos de cambio, velocidades, productividades, tiempos, rendimientos, etc...

La media aritmética es mayor que la geométrica y ésta lo es que la armónica.

Tema 20: Cálculo estadístico 28


• MEDIANA(me) (ESTADÍSTICO ROBUSTO)

Ordenados los valores (xi) de la variable (x) en sentido creciente, la mediana (Me), es el valor (xi) del elemento central del
colectivo o de la muestra, es decir, aquél que deja a cada lado el mismo número de valores.

Es el valor de la variable que se corresponde con la frecuencia absoluta acumulada (ni) primera superior al número total
de datos dividido por dos(n/2).

Si el número de datos fuera par, la mediana (me) se correspondería con la media aritmética (xa) de los dos valores centrales.

En las distribuciones por intervalos, la mediana se calcula a partir del intervalo mediano (li-1-li), es decir, aquél
correspondiente a la primera frecuencia acumulada (ni) igual o mayor que el número total de datos dividido por 2 (n/2).

Me = li-1 + [(n/2-ni-1) /ni]. gi

ni (frecuencia absoluta), gi (amplitud del intervalo)

• MODA(mo)

Es el valor (xi) más repetido de la variable (x), el que se corresponde con la máxima frecuencia absoluta (ni) de la
distribución. En distribuciones por intervalos, se utilizan para su cálculo las marcas de clase y observando el intervalo
modal dónde ni/gi (altura del intervalo es mayor, se aplicará la siguiente fórmula:

Mo = li-1 +[( ni+1/gi+1) / (ni+1/gi+1)+(ni-1/gi-1)] .gi

Tema 20: Cálculo estadístico 29


Siendo ni+1 y ni-1 las frecuencias absolutas de los intervalos anterior y posterior al modal y gi+1 y gi-1 sus respectivas
amplitudes.

Algunos autores proponen que, cuándo la amplitud de los intervalos es constante, se utilice la fórmula siguiente:

o Mo = li-1+gi. ni+1/ni-1+ni+1. otros propugnan:

o Mo = li (real)+ gi. [(ni-ni-1) / 2ni - ni+1- ni-1] dónde ni es la frecuencia absoluta del intervalo modal y li-1 el límite
inferior real del intervalo modal. La moda así planteada, sería la media aritmética del límite superior del intervalo
anterior al modal y el límite inferior de éste. Cómo se verá más adelante, cuándo las curvas de distribución son
algo asimétricas xa-mo=3(xa-me).

Tema 20: Cálculo estadístico 30


MEDIDAS DE DISPERSIÓN/VARIABILIDAD O CONCENTRACIÓN

Un promedio es representativo si los valores (xi) de la variable (x) están concentrados a su alrededor.

Si están muy dispersos, no lo será para poder determinar lo anterior, se suelen calcular otras medidas que relacionan los
valores (xi) de la variable con la media aritmética (xa) o a ésta con alguna de esas medidas previamente calculadas.

• Desviación media (dm)) y Desviación Mediana (dMe)

Es la media aritmética de las diferencias en valor absoluto, entre cada uno de los valores (xi) de la variable y la media
aritmética de los mismos.

dm = + [xi - xa].ni / n

También puede obtenerse la desviación mediana: dMe = + [xi - Me].ni / n

• Varianza(sª)

Es la media aritmética de las diferencias entre los valores (xi) de la variable y su media aritmética (xa), elevadas al cuadrado.

sª = + [ xi-xa]ª .ni / n // sª = +xiª.ni/n - (xini/n)ª

Tema 20: Cálculo estadístico 31


n
( xi − x ) 2 ni
Otra notación es  =
2
x
i =1 N

Características:

o la varianza de una constante es cero.

o la varianza de una suma de variables es igual a la suma de las varianzas de las variables.

o la varianza nunca puede ser negativa.

o si a todos los valores (xi) se les suma una constante (k), la varianza de la distribución no varía, pero si se les
multiplica por dicha constante, queda multiplicada la varianza (k.sª).

o se expresa en las mismas unidades de medida al (ª = 2)

• Desviación típica o estándar (s)

Es la raíz cuadrada positiva de la varianza (sª)

Se expresa en las mismas unidades de medida que la distribución.

Tema 20: Cálculo estadístico 32


Cuando los datos están agrupados en intervalos, se produce un error de agrupamiento, que se corrige con el índice de
Sheppard (sc) que es igual a la raíz cuadrada de la diferencia entre la varianza(sª) y la amplitud del intervalo (gi) elevada
al cuadrado dividida por 12.

Todas estas medidas de dispersión son absolutas, porque están afectadas por la escala de medida de las respectivas
variables (euros, dólares, etc.), por eso es preciso introducir medidas abstractas, es decir, sin escala de medidas, que
permitan comparar los resultados, éstas son las relativas.

• Medidas de Dispersión Relativa

Son un cociente entre una dispersión absoluta y un promedio. Una de las más utilizadas es el coeficiente de variación de
Pearson (cvp), que permite comparar medias aritméticas de varias distribuciones.

Este coeficiente es el cociente entre la desviación típica (s) de la distribución y la media aritmética; va expresado en tanto
por ciento y es por tanto adimensional, lo que permite comparar distribuciones diferentes [cvp = (s / xa) .100]

No tiene sentido cuándo la media aritmética es igual a cero. Cuánto menor sea cvp, menor será la dispersión entorno a la
media aritmética (xa) y ésta será más representativa de los datos de partida; cuanto mayor sea cvp, menor representatividad
de la media (xa)

Tema 20: Cálculo estadístico 33


Ejemplo 6: Los siguientes datos representan los porcentajes del ingreso familiar asignados a una compra en una muestra
de 30 compradores.

26 28 30 37 33 30 29 39 49 31

38 36 33 24 34 40 29 41 40 29

35 26 42 36 37 35 44 32 45 35

Calcule las desviaciones media y mediana y la varianza y la desviación típica

La media es 34,76 y la mediana 35, por lo que:

xi xi − x xi − M e xi xi − x xi − M e

24 10,76 11 35 0,24 0

26 8,76 9 36 1,24 1

26 8,76 9 36 1,24 1

28 6,76 7 37 2,24 2

Tema 20: Cálculo estadístico 34


29 5,76 6 37 2,24 2

29 5,76 6 38 3,24 3

29 5,76 6 39 4,24 4

30 4,76 5 40 5,24 5

30 4,76 5 40 5,24 5

31 3,76 4 41 6,24 6

32 2,76 3 42 7,24 7

33 1,76 2 44 9,24 9

33 1,76 2 45 10,24 10

34 0,76 1 49 14,24 14

35 0,24 0 Suma 145,48 145

35 0,24 0

Tema 20: Cálculo estadístico 35


Y aplicando las formulaciones propias de la desviación media y de la desviación mediana, tendremos:

n 30
1 1 145,48
Dx =
n

i =1
xi − x  Dx =
30

i =1
xi − x =
30
= 4,84

n 30
1 1 145
Dm =
n
x
i =1
i − Me  Dx =
30
x
i =1
i − Me =
30
= 4,83

n
( xi − x ) 2 ni
Para aplicar la fórmula de la varianza  x2 =  necesitamos obtener primero la columna ( xi − x) y luego la columna
i =1 N

( xi − x) 2

xi ( xi − x) ( xi − x) 2 xi ( xi − x) ( xi − x) 2

24 -10,76 115,92 35 0,24 1,52

26 -8,76 76,85 36 1,24 1,52

Tema 20: Cálculo estadístico 36


26 -8,76 76,85 36 1,24 4,99

28 -6,76 45,79 37 2,24 4,99

29 -5,76 33,25 37 2,24 10,45

29 -5,76 33,25 38 3,24 17,92

29 -5,76 33,25 39 4,24 27,39

30 -4,76 22,72 40 5,24 27,39

30 -4,76 22,72 40 5,24 38,85

31 -3,76 14,19 41 6,24 52,32

32 -2,76 7,65 42 7,24 85,25

33 -1,76 3,12 44 9,24 104,72

33 -1,76 3,12 45 10,24 202,59

34 -0,76 0,59 49 14,24 1,52

Tema 20: Cálculo estadístico 37


35 0,24 0,05 Suma 1069,37

35 0,24 0,05

n
( xi − x ) 2 ni 1069,37
Por lo que
 =
2
x = = 35,64
i =1 N 30

Una vez conocida la varianza, para calcular la desviación típica se trata simplemente de obtener la raíz cuadrada positiva
de este estadístico:

 2 = 35,64   =  2 = 35,64 = 5,97

Tema 20: Cálculo estadístico 38


20.1.4. ESTADÍSTICAS DE DOS VARIABLES

• CONCEPTO

En la práctica es muy frecuente que en el estudio de una población estemos interesados en medir no sólo una, sino varias
variables; cuando estudiamos dos variables de una población tenemos una distribución de frecuencias bidimensional,
sí estudiamos múltiples variables dispondremos de una distribución de frecuencias multidimensional.

Ejemplo, en la caracterización de la población que visita una determinada ciudad, podemos estar interesados en conocer la
nacionalidad y el nivel de renta de los visitantes (distribución bidimensional), pero también y además, el motivo de la visita,
la duración de la estancia, el medio de locomoción empleado para llegar a la ciudad, el gasto realizado en su estancia, la
distribución del gasto por conceptos, etc. (distribución multidimensional).

Centrándonos en las distribuciones bidimensionales, tendremos, para cada individuo observado los valores
correspondientes a dos variables o dos atributos, que denotamos por x e y.

La posibilidad de que la información observada se corresponda con un valor o con un atributo, nos da varios tipos de
distribuciones bidimensionales, a saber:

− Las dos informaciones son cualitativas (dos atributos, cada uno con sus diversas modalidades); medimos, por
ejemplo, la nacionalidad y el motivo de la visita.

− Una de las informaciones corresponde a una variable (datos cuantitativos discretos o continuos) y otra a un atributo;

Tema 20: Cálculo estadístico 39


medimos, por ejemplo, el gasto realizado y el medio de locomoción empleado.

− Las dos informaciones son cuantitativas (discretas o continuas); por ejemplo, el gasto realizado y la duración de la
estancia.

Se llama distribución conjunta de frecuencias de las dos variables (x, y) a la tabla que representa los valores observados
de ambas variables y las frecuencias relativas de aparición de cada una de las variables.

Cuando las variables son cuantitativas a las tablas de frecuencias se les denomina Tablas de Correlación y cuando se
trata de atributos o variables cualitativas se las denomina Tablas de Contingencia.

Las distribuciones bidimensionales adoptan el siguiente formato general:

Tema 20: Cálculo estadístico 40


y y1 y2 ...... yj ...... ys ni.

x1 n11 n12 ...... n1j ...... n1s n1.

x2 n2 n22 ...... n2j ...... n2s n2.

..... ..... ...... ...... ...... ...... ...... ......

xi nI1 ni2 ...... nij ...... nis ni.

..... ..... ...... ...... ...... ...... ...... ......

xr nr1 n r2 ...... nrj ...... nrs nr.

n.j n.1 n .2 ...... n.j ...... n.s n.. =N

Tema 20: Cálculo estadístico 41


Dónde:

x1 , x2 ....., xr Son los r valores o modalidades que toma la variable o atributo x.

y1, y2 ....., ys Son los s valores o modalidades que toma la variable o atributo y.

ni1, ni2 ....., nis Es la frecuencia o número de veces en la que aparece el valor o modalidad i de la variable o atributo X
conjuntamente con los valores o modalidades 1, 2, .. s de la variable o atributo Y.

n1j, n2j ....., nij Es la frecuencia o número de veces en la que aparece el valor o modalidad j de la variable o atributo Y
conjuntamente con el valor o modalidad 1, 2, .. r de la variable o atributo X.

ni. Es la frecuencia total con la que aparece el valor o modalidad i de la variable o atributo X.

n.j Es la frecuencia total con la que aparece el valor o modalidad j de la variable o atributo Y.

N= n.. Es la frecuencia total de la distribución.

Tema 20: Cálculo estadístico 42


Ejemplo 7. Se ha preguntado a una muestra de clientes de un hotel sobre el modo de transporte utilizado para su
desplazamiento al mismo, obteniendo los siguientes resultados relacionados con la nacionalidad del turista:

Nacionalidad Avión Autobús Vehículo Otros Total


particular

Alemanes 100 500 150 75 825

Franceses 300 250 100 15 665

Belgas 200 50 300 2 552

Españoles 400 300 450 2 1152

Japoneses 50 5 2 0 57

Norteamericanos 800 10 10 1 821

Otras nacionalidades 70 215 55 8 348

Total 1920 1330 1067 103 4420

Tema 20: Cálculo estadístico 43


xi Es el atributo nacionalidad, que toma las modalidades x1 = Alemanes, x2 = Franceses ....., xr = Otras
nacionalidades.

yi Es el atributo modo de transporte que toma las modalidades y1 = Avión, y2 = Autobús ....., ys = Otros
modos de transporte.

n11, n12..., n1s Es la frecuencia en la que aparece el atributo 1 de la variable x (Alemán) conjuntamente con cada uno
de los atributos de y (n11 = 100 (100 alemanes llegan en Avión, n12 ....., n1s = 75 (75 alemanes llegan por
otros medios).

n11, n22..., n3j Es la frecuencia en la que aparece el atributo 1 de y (Avión) conjuntamente con los distintos atributos 1,
2, .. s de la variable X (n11 = 100 n21 = 300 nr1 = 70, de otras nacionalidades que vienen por avión).

ni. Es la frecuencia total con la que aparece la modalidad i de la variable x (n1. = 825, es decir que el número
total de alemanes que visitaron el hotel fue de 825).

n.j Es la frecuencia total con la que la modalidad j de la variable y (n.2 = 1330, indicativa de que el número
de clientes que llegó al hotel en autobús fue de 1330 personas).

N = n.. Es la frecuencia total de la distribución, en el ejemplo 4.420 clientes.

Tema 20: Cálculo estadístico 44


Las distribuciones marginales aparecen cuando se estudian aisladamente las variables con independencia del resto. Así, al
igual que en las distribuciones unidimensionales podemos definir la frecuencia relativa de un elemento (xi, yj) en base a
la relación:

nij
f ij =
n••

Como puede comprobarse, se verifica que la suma de todas las frecuencias relativas es igual a 1, es decir:

r s

 f
i =1 j =1
ij =1

Las distribuciones de dos variables permiten obtener todos estadísticos similares a los indicados para las distribuciones de
una variable; obtener representaciones gráficas conjuntas y estimar los cambios que se producen en una variable cuando
se producen modificaciones en la otra variable.

Veamos un ejemplo muy simple para ver las posibilidades que ofrece el análisis estadístico:

Tema 20: Cálculo estadístico 45


Ejemplo 8. Una compañía quiere realizar un estudio sobre la influencia del gasto en publicidad sobre sus ventas. Para ello
dispone de los siguientes datos sobre los últimos años:

Años Gastos millones Ventas millones

2014 3,0 130

2015 3,3 155

2016 3,8 175

2017 4,2 210

a) Realice un gráfico de dispersión.

El gráfico se construye de la siguiente forma, utilizando cualquier programa de gráficos o una hoja de cálculo.

Tema 20: Cálculo estadístico 46


Relación Gastos con Ventas

230
210
190
170

Ventas
150
130
110
90
70
50
2.5 3 3.5 4 4.5

Gastos

Además de esta representación, podemos obtener una ecuación matemática que nos la relación las dos variables y nos
permita, por ejemplo, predecir las ventas de 2018 si el gasto en publicidad aumenta hasta 4,5 millones, por ejemplo.

Introduciremos al efecto en algunos conceptos básicos que se utilizan al respecto:

Tema 20: Cálculo estadístico 47


20.1.5. MEDIDAS DE DEPENDENCIA ESTADÍSTICA

A. COVARIANZA (Sxy)

Es la media aritmética de los productos de las diferencias entre los valores de (xi ; yj) de cada variable y la media aritmética
(xa ; ya) de los mismos.

sxy = +(xi-xa) .(yj-ya) .nij / n ; sxy = +[Link] /n - (+[Link]/n) .(+[Link]/n)

Se utiliza para estudiar el grado de dependencia estadística o relación existente entre las variables x e y.

• Covariación funciona, exacta o matemática (lineal).

Cuando a cada valor (xi) de la variable x , le corresponde un único valor (yj) de la variable y; sí a cada valor (xi) de la variable
x no le corresponde un único valor (yj) de la variable y, se dirá que se existe una covariación estadística (nube de puntos).

La dependencia estadística (correlación), puede ser de tipo directo, de tipo inverso o inexistente (incorrelación), los dos
primeros tipos se producen si al crecer una de las variables, la otra también crece o decrece. Para conocer cómo se
comportan las variables, se recurre al ajuste de una línea a la nube de puntos.

Tema 20: Cálculo estadístico 48


• Ajuste lineal y de curvas (análisis de regresión)

se podría decir que es la sustitución de una covariación estadística por otra funcional o exacta a través de una función
matemática lineal, parabólica, exponencial, etc. , elegida por ser la que mejor se adapta a la observación de la
representación gráfica de la nube de puntos de los pares de puntos (xiyj).

• Análisis por el Método de los mínimos cuadrados

Es uno de los métodos de ajuste más usuales se basa en la obtención de la función matemática que haga mínima la suma
de los cuadrados de las diferencias entre los valores (yj) observados, reales o empíricos y los valores ajustados o funcionales
(yo) , obtenidos a través de dicha función matemática.

es decir, hacer mínimo +(yj-yo)ª ; (ª=2)

Para hallar la función matemática, se toma la ecuación de la recta yo = a+bx , y se deriva respecto al parámetro “a” y se
iguala a cero y después se hace lo mismo con el parámetro “b” , obteniendo así un sistema de dos ecuaciones con dos
incógnitas “a” y “b” .

+ yj = a. n + b . +xi

+xi yj = a . +xi + b . +xiª ;

Tema 20: Cálculo estadístico 49


y i = Na + b xi

yx i i = a  xi + b xi2

20.1.6. SERIES CRONOLÓGICAS O TEMPORALES: COMPONENTES

A. CONCEPTO

Una serie cronológica es un conjunto de datos que recogen la evolución de los valores (yj) de la variable (y), a través de los
valores (ti) del período de tiempo analizado (t), normalmente los valores (ti) de la variable tiempo (t), suelen venir dados en
intervalos constantes.

B. USO

La utilidad de la investigación estadística de series cronológicas es que permite:

− Obtener los datos que faltan en alguna serie dada, a esto se le denomina interpolar prever valores (yj) futuros de
la variable y analizada, a esto se le denomina extrapolar valores aceptables.

Tema 20: Cálculo estadístico 50


C. COMPONENTES

Son la agrupación de los distintos factores o fuerzas que actúan sobre los valores (yj) de la variable, los cuatro grandes
componentes son: tendencia secular, variaciones estacionales, variaciones cíclicas y variaciones accidentales.

• Tendencia secular (t)

Es una variación lenta y regular que marca la dirección persistente de la serie observada en un período de tiempo amplio
(a veces se asimila a un promedio dentro de la tendencia a largo plazo), existen diversos procedimientos para determinar
la tendencia secular (elaborando la recta de los puntos medios una vez representada en coordenadas cartesianas, mediante
medias móviles, por un sistema de mínimos cuadrados que es similar a las ecuaciones explicadas en el ejemplo 9 anterior,
etc.

• Variaciones Estacionales o periódicas (e)

Son aquellos cambios en la tendencia normal, motivados por la influencia de determinados acontecimientos periódicos o
estacionales (cosechas, vacaciones, etc.)

Los procedimientos de cálculo suelen apoyarse en los denominados índices estacionales o cociente de las variaciones
porcentuales entre los datos periódicos (mensuales, trimestrales, etc.) y la media aritmética anual de los mismos, siendo
ésta del 100% y la suma anual de aquéllos de 1200.

Tema 20: Cálculo estadístico 51


Se calcularán una vez eliminadas las tendencias y otras posibles variaciones (cíclicas y/o accidentales), entre los diferentes
métodos existentes, se consideran los dos más usuales:

• Variaciones Cíclicas

Son oscilaciones en los valores de la variable, que abarcan un período de tiempo largo (normalmente superior al año),
aunque no siempre de la misma amplitud. Así se oye hablar de los ciclos de las primas de seguros, el comportamiento
cíclico de la economía…

Para calcular los índices cíclicos basta con eliminar la tendencia (cuándo los datos son anuales), para eliminar la tendencia,
si se quieren hallar variaciones cíclicas anuales, se puede hacer por diferencia entre el dato y la tendencia.

Si lo que se quiere hallar son variaciones cíclicas relativas, se calculará el cociente entre el dato y la tendencia. Si los datos
son mensuales, se deben eliminar la tendencia y las variaciones estacionales. Así si se parte del modelo multiplicativo yj =
t .e. c .a., las variaciones cíclicas y accidentales c.a = yj / t.e.

• Variaciones Accidentales

Son movimientos esporádicos de corta duración, de sucesos ocasionales o accidentales (catástrofes naturales, elecciones,
etc.), que a veces son tan intensos que pueden originar una nueva tendencia o un nuevo ciclo.

Tema 20: Cálculo estadístico 52


20.2. TEORÍA DE LA POBLACIÓN Y ANÁLISIS DEMOGRÁFICO

• Demografía

La Demografía es la ciencia que tiene como objetivo el estudio de las poblaciones humanas y que trata de su dimensión,
estructura, evolución y características generales, considerados desde un punto de vista cuantitativo. Por tanto la Demografía
estudia estadísticamente la estructura y la dinámica de las poblaciones humanas y las leyes que rigen estos fenómenos.

• Tipos de Demografía:

Los dos tipos o partes de la Demografía están interrelacionados entre sí y la separación es un tanto artificial, puesto que el
objetivo de estudio es el mismo: las poblaciones humanas.

Demografía estática: Es la parte de la Demografía que estudia las poblaciones humanas en un momento de tiempo
determinado desde un punto de vista de dimensión, territorio, estructura y características estructurales.

La dimensión es el número de personas que residen normalmente en un territorio geográficamente bien delimitado.

El territorio es el lugar de residencia de las personas que puede globalizarse o desagregarse como puede ser una nación,
región, provincia, ciudad, municipio, etc.

Tema 20: Cálculo estadístico 53


La estructura de una población es la clasificación de sus habitantes según variables de persona. Según las Naciones Unidas
Estas variables son: edad, sexo, estado civil, lugar de nacimiento, nacionalidad, lengua hablada, nivel de instrucción, nivel
económico y fecundidad.

Demografía dinámica: Es la parte de la Demografía que estudia las poblaciones humanas desde el punto de vista de la
evolución en el transcurso del tiempo y los mecanismos por los que se modifica la dimensión, estructura y distribución
geográfica de las poblaciones, como son la natalidad, mortalidad, emigración e inmigración.

• Fuentes de la Demografía:

1. Censos

El censo de población: es un conjunto de operaciones que reúnen, elaboran y publican datos demográficos, económicos y
sociales correspondientes a todos los habitantes de un país o territorio, referidos a un momento determinado o a ciertos
períodos dados.

Los censos son la principal Fuente de Datos Demográficos por la gran cantidad de información. Da una fotografía de la
población. Describe estadísticamente las poblaciones humanas consideradas desde un punto de vista estático. Es la fuente
primaria de las Estadísticas Básicas de Población que son necesarias para fines gubernamentales y aspectos de
planificación económica y social. Se usa para:

− base para el análisis y la evaluación demográfica.

Tema 20: Cálculo estadístico 54


− proyectar, establecer y desarrollar políticas de gobierno.

− hacer estimaciones de las distintas variables captadas en el Censo.

− "marco muestral" para encuestas.

− referencia para las Estadísticas Continuas (Vitales).

− determinar los Sistemas Electorales de un país.

− comparabilidad internacional.

− fijar la representación electoral.

Requisitos:

− Territorio Definido: deben tener un área territorial definida con precisión. Implica una División Política-Administrativa
y todas aquellas herramientas de tipo cartográfico que aseguren una completa captación de información, sin
omisiones ni duplicaciones.

− Universalidad: para la exactitud y cabalidad sin duplicaciones ni omisiones.

− Simultaneidad: para el recuento exacto de la población total, para relacionar los datos de la población con un
momento o período de tiempo bien definido. Generalmente se fija una fecha para el levantamiento censal y además

Tema 20: Cálculo estadístico 55


casi siempre una hora y un momento determinado, que se denomina "momento censal". Este momento se señala
a menudo a media noche y sirve de línea cronológica que separa a las personas que nacen o mueren después y,
de este modo determinar cuáles deben figurar o no en el Censo.

− Periodicidad: realización en intervalos regulares. Tiene gran importancia para determinar las tendencias
demográficas.

2. Pirámides de población

La pirámide de población es la representación gráfica de la distribución por edad y sexo de la población. Toma el nombre
de la forma que debe adoptar en las sociedades con una población equilibrada, con una amplia base debido al gran número
de nacimientos que se estrecha paulatinamente por la mortalidad creciente a medida que aumenta el intervalo de edades
considerado.

La Pirámide de Edades es un medio de representación gráfica que permite estudiar la estructura por edad y sexo de una
población. Revelan una gran cantidad de información sobre patrones históricos de natalidad y mortalidad de varias
generaciones. Al presentar el número absoluto o el porcentaje de varones y mujeres en cada edad o grupo de edad, da una
idea clara de las características de una población.

2.1. Pirámides con población de tipo expansiva

Presentan una base ancha y un angostamiento progresivo y regular hasta la cúspide de la pirámide. En general y
normalmente caracteriza a los países con fuerte natalidad y mortalidad media o fuerte. Implica poblaciones jóvenes.

Tema 20: Cálculo estadístico 56


2.2. Pirámides con población de tipo constructiva

Presentan un angostamiento pronunciado en la base, con un menor número de personas en las edades menores,
evidenciando que las cohortes o generaciones recientes han sido progresivamente menos numerosas que las anteriores,
lo que ha hecho que la estructura de edades cambie de "expansiva" a "constrictiva. En general y normalmente, caracteriza
a los países con natalidad decreciente y mortalidad estable. Implica poblaciones en transición a envejecida.

2.3. Pirámides con población de tipo estacionaria

Presentan un similar número de personas aproximadamente en todos los grupos de edad con una reducción paulatina en
las edades más avanzadas. En general y normalmente, caracteriza a países con valores en natalidad igual a los valores en
mortalidad. Implica poblaciones envejecidas.

La pirámide de cada país permite ver los efectos de los principales acontecimientos ocurridos en el transcurso de varias
generaciones.

Por ejemplo, los de las dos Guerras Mundiales, donde se notan claramente las grandes pérdidas en hombres en la II Guerra
Mundial, epidemias, migraciones y “baby booms”. Además se puede observar el predominio de un sexo en las edades
menores y mayores como resultado de patrones de natalidad y la mortalidad diferencial, entre otros.

Hay tres combinaciones posibles en las relaciones entre la variable “nacimientos y defunciones”:

Tema 20: Cálculo estadístico 57


1.- Mortalidad Alta versus Natalidad Alta....................Población estable

2.- Mortalidad Alta versus Natalidad Baja....................Población en extinción

3.- Mortalidad Baja versus Natalidad Alta....................Población joven

• TABLAS DE MORTALIDAD:

Una tabla de mortalidad nos informa de cómo evoluciona la mortalidad de un colectivo dado de personas a lo largo del
tiempo hasta su extinción.

La tabla presenta dos primeras columnas, la primera con edades expresadas en años enteros y en la segunda con el número
de personas que sobreviven a esa edad. Hay que señalar que:

o El colectivo es cerrado, es decir, el colectivo inicial no tiene incorporaciones y solo sufre bajas.

o Las bajas del grupo se dan solo por fallecimiento.

Tema 20: Cálculo estadístico 58


− Los sobrevivientes (lx)

Veamos algunos valores, entre 40 y 50 años de edad, de una tabla de mortalidad, en este caso la tabla GRM-95, tabla
mortalidad masculina de experiencia suiza, que se recoge en su totalidad en el ANEXO-I

x lx dx qx qx*1000

40 948.168 1.765 0,0018615 1,8615

41 946.403 1.883 0,0019896 1,9896

42 944.520 2.017 0,0021355 2,1355

43 942.503 2.166 0,0022981 2,2981

44 940.337 2.338 0,0024863 2,4863

45 937.999 2.531 0,0026983 2,6983

Tema 20: Cálculo estadístico 59


46 935.468 2.751 0,0029408 2,9408

47 932.717 3.002 0,0032186 3,2186

48 929.715 3.286 0,0035344 3,5344

49 926.429 3.587 0,0038719 3,8719

50 923.842 3.892 0,0042174 4,2174

En la primera columna, x, se representan las edades en años enteros (si el colectivo es de mujeres la letra es y).

En la segunda columna, lx, aparecen los sobrevivientes a cada edad, por lo que quizás fuese más correcto hablar de tabla
de sobrevivencia.

La tabla comienza en la edad 0 con un millón de individuos, lo que se denomina radix de la tabla. Es decir, de un colectivo
de 1.000.000 de individuos, en el momento del nacimiento, alcanzan la edad de 40 años un total de 948.168, la de 41 años
946.403, la de 42 años 944.520… etc. Los valores están referidos al momento inicial de cada edad.

Tema 20: Cálculo estadístico 60


− Los fallecimientos (dx)

Conocidos los valores de los sobrevivientes es fácil deducir los fallecimientos que se producen en un año, es decir, el
número de personas de una edad x que no alcanzan la edad x+1.

De un colectivo de 948.168 de individuos de edad 40 años, no alcanzan un año más de edad 1.765, diferencia entre 948.168
y 946.403, o lo que es lo mismo 1.765 fallecen en el transcurso de un año. De 946.403 individuos de edad 41 año, no
alcanzan un año más de edad 1.883, diferencia entre 946.403 y 944.520, o lo que es lo mismo 1.883 fallecen en el transcurso
de un año. Y así sucesivamente.

− La probabilidad de fallecimiento (qx)

Conocido el dato de los sobrevivientes a una edad y el número de ellos que no alcanzan a vivir un año más, o lo que es lo
mismo, el número de los fallecidos en el transcurso del siguiente año, podemos deducir cual es la probabilidad de
fallecimiento de una persona de edad x en el transcurso del año siguiente.

Para ello se divide el número de personas de esa edad que fallecen a lo largo de un año entre el número de personas de
esa edad que estaban vivas al inicio de ese año, valor que se designa como qx.

Es decir, para un individuo de 40 años de edad, por ejemplo, la probabilidad de fallecer a lo largo del año siguiente viene
dada por el cociente entre los que fallecen en el transcurso del año siguiente, 1.765, y los que vivían al inicio de esa
anualidad, 948.168: 1.765/948.168 = 0,0018615 lo que quiere decir que “la probabilidad de que un individuo de 40 años
fallezca en el transcurso del año siguiente es del 0,0018615”. Esta magnitud es muy común multiplicarla por 1.000, valor

Tema 20: Cálculo estadístico 61


que aparece en la quinta columna y, por tanto, se expresaría diciendo “de cada mil individuos de edad de 40 años fallecen
en el transcurso del año siguiente 1,8615 individuos”.

Puede resultar chocante que fallezca un número de individuos no entero, lo que obviamente no es posible ya que no fallecen
partes de individuo, pero la probabilidad es un valor que deriva de un cociente, casos favorables divididos por los casos
posibles, y se nos darán valores no enteros.

− La probabilidad de supervivencia

Si la probabilidad buscada no es la de fallecimiento sino la de supervivencia el razonamiento sería exactamente el mismo:

o Queremos saber cuál es la probabilidad de que un individuo de 40 años de edad viva un año más, es decir,
que siga vivo a los 41 años de edad.

o La tabla nos informa de que a los 40 años viven 948.168 y de esos alcanzan los 41 años son 946.403.

o Por lo que la probabilidad buscada es: 946.403/948.168 = 0,9981385.

o Que expresada en por mil sería: de cada mil individuos de edad de 40 años viven un año más 988,1385.

Los valores: lx, dx y qx referidos a una edad x, son los que aparecen normalmente en una tabla de mortalidad. A partir de
ellos es posible calcular cualquier otra probabilidad, la probabilidad de fallecer en los próximos cinco años, por ejemplo, la
probabilidad de que un individuo de 40 años fallezca antes de cumplir los 45, para lo cual:

Tema 20: Cálculo estadístico 62


o Conocemos por la tabla los que viven a los 40 años: 948.168.

o Conocemos por la tabla los que viven a los 45 años: 940.337.

o Por tanto, conocemos los que fallecen en el transcurso de esos cinco años: 948.168-940.337=7.831.

o Por lo que la probabilidad de fallecimiento buscada sería: 7.831/948.168=0,0082591.

o lo que es lo mismo: de cada mil individuos de 40 años de edad 8,2591 fallecen en el transcurso de los cinco
años siguientes.

Lo anterior son ejemplos que tratan de dar una idea de cómo se trabaja con una tabla de mortalidad para calcular las
probabilidades de fallecimiento y supervivencia ya que las probabilidades son los datos realmente importantes que
proporcionan las tablas.

• LA PROBABILIDAD:

La probabilidad de un suceso es siempre positiva y se da siempre entre dos valores: 0 y 1. La probabilidad cero es la
probabilidad de que un suceso seguro no se va a dar y la probabilidad 1 será la del suceso que seguro que sí se va a dar.
Cuanto más cerca esté la probabilidad de cero el suceso será menos probable que se dé y cuanto más se vaya acercando
a 1 se dará más ciertamente.

Tema 20: Cálculo estadístico 63


La vida humana es un suceso que se da solo con dos posibilidades, es lo que se llama un suceso dicotómico. Hay
supervivencia y en cierto (o incierto) momento dejará de haberla. Es decir, partiendo del suceso supervivencia en los
momentos futuros podrá seguir dándose la supervivencia o tendrá lugar el fallecimiento.

Si tomamos las probabilidades que hemos obtenido para el ejemplo de un individuo de 40 años, que han sido

o Probabilidad de fallecer en el año siguiente: 0,0018615 (1,8615 por mil)

o Probabilidad de supervivencia transcurrido un año: 0,9981385(998,1385 por mil)

Y sumamos ambas probabilidades, 0,0018615+0,9981385, obtenemos el valor 1 (1000 si sumamos 1,8615+998,1385). Lo


que nos permite, conocido uno de los valores, la probabilidad de fallecimiento, por ejemplo, obtener la otra probabilidad, la
de supervivencia, restando la conocida de 1 (o de 1.000).

Lo que es lógico ya que es cierto que el individuo morirá o sobrevivirá, y no hay otras alternativas, por lo que la probabilidad
de esa certeza, o vive o muere, se mide con probabilidad 1.

Hay que señalar que al hablar de probabilidad estamos hablando de grandes números y dentro de un contexto de grandes
números tiene sentido hablar de probabilidades.

Si tenemos un grupo de 10 personas de 40 años será complicado observar si se cumple la tabla: si fallece una persona la
mortalidad será del 0,1 (del 100 por 1.000) y si no fallece nadie será de 0, pero es imposible que en un año fallezcan
0,0018165.

Tema 20: Cálculo estadístico 64


o Si el grupo es de 1.000 deberían darse 1 o 2 fallecimientos (no 1,8615)

o Si el grupo es de 10.000 se darán entre 18 y 19 fallecimientos ( no 18,615)

o Si el grupo es de 100.000 se darán 186 o 187 fallecimientos (no 186,15)

o Si el grupo es de 1.000.000 se darán 1.861 o 1.862 (no 1.861,5)

Se observa que cuanto mayor es el colectivo, los valores teóricos y reales de los fallecimientos que se deducen de los
valores de las probabilidades de la tabla, se aproximan más. Si el colectivo es muy pequeño las desviaciones son muy
grandes por eso, insistimos, cuando se habla de probabilidades se habla en relación a grandes números.

• EL TIPO DE INTERÉS:

Como vimos en su momento, otro elemento esencial en el cálculo de la prima en un seguro de vida es el tipo de interés,
principalmente en los seguros de supervivencia.

Veamos otro sencillo ejemplo: una persona, varón de 45 años, desea que al cabo de un año se le paguen 1.000 euros para
ello se dirige primero a un banco y después a una compañía de seguros. (Imaginemos un tipo vigente en el mercado del
7% anual)

− Operación bancaria: para darle 1.000 euros al cabo de un año el banco le pedirá una cantidad tal que más el 7%
de 1.000 euros al cabo de un año: 934,58 euros (0,07*934,58 = 65,42, 934,58+65,42 = 1.000).

Tema 20: Cálculo estadístico 65


− Operación de seguros: para darle 1.000 al cabo de un año el asegurador hará lo siguiente:

Le preguntará su edad. 45 años.

Irá a la tabla para ver su probabilidad de supervivencia: l45 = 937.999 y l46 = 935.468, por lo que la probabilidad
de que un varón de 45 años viva un año más es: 935.468/937.999 = 997,30 por mil. Es decir, de cada 1.000 de
45 años viven un año más 997,30.

A la vista de lo anterior el asegurador pedirá una cantidad tal que más el 7% de 997,30 euros: 932,06 euros
(0,07*932,06 = 65,24, 932,06 + 65,24 = 997,30)

Y así se pone de manifiesto la diferencia entre la operación puramente financiera y la operación aseguradora:

o En la operación financiera sólo se considera el tipo de interés y el banco sabe que, pasado un año, tendrá
que pagar 1.000 euros, a quien contrató la operación o a su herederos, si fallece.

o En la operación de seguros se considera el tipo de interés y la probabilidad de supervivencia, el asegurador


solo pagará pasado el año si, y solo si, la persona vive y como la tabla le informa que de cada mil vivirán un
año más 997,30 al asegurador le hará falta tener, no 1.000, sino 997,30 euros.

Si la tabla no se cumple exactamente y viven más: el asegurador perderá dinero, porque deberá pagar más de lo previsto.

Si la tabla no se cumple exactamente y viven menos: el asegurador ganará dinero, porque deberá pagar menos de lo
previsto.

Tema 20: Cálculo estadístico 66

También podría gustarte