0% encontró este documento útil (0 votos)
20 vistas90 páginas

CLASE 1 Mastrer

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
20 vistas90 páginas

CLASE 1 Mastrer

Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Dirección de Posgrado

Ing. Carlos Ramiro Peñafiel Ojeda Ph.D.


1- Introducción a la Estadistica

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción

Qué hacemos ?
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción

Generación

Depuración

Transformación y/o tratamiento

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción
Experimento Unidad Experimental
Un experimento es un cambio en las
condiciones de operación de un La unidad experimental, representa un
elemento simple o compuesto en
proceso, que se hace con el objetivo
función del objetivo de la investigación
de medir el efecto del cambio sobre que se realizan las observaciones o
una o varias propiedades de un algo. mediciones de interés.
Por ejemplo, en un proceso químico
del agua pueden probar: color, olor,
turbiedad, pH, residuo fijo,
conductividad, dureza, calcio,
magnesio, alcalinidad, sulfato, nitrato,
nitrito, amonio, cloro residual y
oxidabilidad observados en un
proceso.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción
Colectivo
Conjunto de unidades experimentales agrupadas bajo una característica en común

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción
Variable
Característica que cambia de una unidad experimental a otra, se induce a partir de dos datos de
tipo categórico o numérico. Existen dos tipos de variables

Nominales
Cualitativas A B C
(categórica) Ordinales
I II III
Variable
Discretas
Cuantitativas 2 4 12
(numéricas) Continuas
-1.345 80.9

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1 Introducción
EJEMPLO.- En la siguiente tabla se muestran los datos de clientes de un supermercado.
Podemos observar que las variables corresponden a los encabezados de cada
columna; por ejemplo: género, edad, ingresos anuales, nivel de gasto o antigüedad de
los usuarios, y los datos son los valores que toman las variables para cada cliente.

Artículos
Nº Cliente Género Edad Gasto Antiguedad
adquiridos
1 Masculino 19 15 20.01 79
2 Masculino 21 15 27.16 43
3 Femenino 20 16 23.95 48
4 Femenino 23 16 28.60 60
5 Femenino 31 17 69.32 153
Cualitativa Cuantitativa Cuantitativa Cuantitativa Cuantitativa
Nominal Discreta/ Discreta Continua Discreta
Continua

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
EJEMPLO.- Se ha realizado un estudio a los estudiantes respecto a las horas de
dedicación que le darán para estudiar el módulo de Análisis de Datos Maestría en
Ingeniería en Seguridad Industrial en la semana antes del examen final.

La población y muestra de este estudio serán los alumnos del módulo de la maestría, y
la variable de estudio será el número de horas de estudio en la semana antes del
examen final. Para este caso, la variable será cuantitativa continua.

Los datos se han recogido a través de una encuesta anónima.

Está claro que lo primero que habrá que hacer


es ordenar todos estos datos para poder
1 3’5 1 … 7 … realizar nuestro estudio.
3 2
2’5
La organización de datos permite la
0 … 1’5 6 … 6’5 construcción de tablas y gráficos

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Nivel Número de
Educativo Personas
Analfabeto 3 La presentación de los datos en tablas y
Básica 10 gráficos permite:
Media
7
General • Identificar patrones iniciales
Universitario 5
TOTAL 25 • Comprender la información que
contiene los datos

• Preparar los datos para el resumen o el análisis.

• Ofrecer una descripción general de los datos

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos

REPETICIONES OCURRENCIA OBSERVACIONES


NÚMERO DE VECES
Tabla de Frecuencias
Nivel Número de
Una tabla de frecuencias solo Educativo Personas
representa una variables, Analfabeto 3

MODALIDADES

FRECUENCIA
cada fila de la tabla Básica 10

representa una modalidad o Media


General
7
valor, y las columnas su Universitario 5
frecuencia TOTAL 25

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Distribuciones de frecuencias

La tabulación y organización inicial de las variables se


denomina matriz en bruto y su disposición puede atender a
las siguientes distribuciones:

- Distribución estadística uniforme


- Distribución estadística de frecuencia sin clases
- Distribución estadística de frecuencia con clases

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Distribución estadística Unitaria
La distribución estadística unitaria es propia de los datos sin
agrupación resultantes de la observación de variables
cuantitativas y cualitativas, el patrón de organización de
variables refiere el dominio de cada una a través de un
vector fila o un vector columna.
Vector columna Vector fila
Unidad Variable
experimental X Unidad
u.e. experimental 𝑢 𝑢 ⋮ 𝑢
𝑢 𝑥 u.e.
𝑢 𝑥
⋮ ⋮ Variable
𝑥 𝑥 ⋮ 𝑥
𝑢 𝑥 X

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias -- CONSTRUCCIÓN

Estado Civil: casado, soltero, soltero, casado, casado, viudo, viudo, soltero,
soltero, divorciado
Tabla 1.- Estado Civil de Encuestados
Número de
Estado Civil
Personas
Soltero 4
Casado 3 Tabla de frecuencias para variables
Divorciado 1
cualitativas (Escala Nominal)
Viudo 2
TOTAL 10

Fuente: Datos imaginarios


Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias -- CONSTRUCCIÓN

Clase Social: baja, baja, baja, media, baja, alta, alta, media, baja, alta

Tabla 2.- Clase social de los Encuestados

Número de
Estado Civil
Personas
Baja 5
Media 2
Tabla de frecuencias para variables
cualitativas (Escala Ordinal)
Alta 3
TOTAL 10

Fuente: Datos imaginarios

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias -- CONSTRUCCIÓN

Edad : 10, 10, 11, 11, 11, 11, 10, 10, 9, 9.

Tabla 3.- Edad de Encuestados

Número de
Edad
Personas
9 4
10 3
Tabla de frecuencias para variables
cuantitativas (Escala de intervalo o
11 3
razón)
TOTAL 10

Fuente: Datos imaginarios

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Distribución estadística de frecuencias sin clase

Frecuencia absoluta: ni
Notación - Frecuencias Simples
Frecuencia relativa : fi=ni/N; Σfi=1

Tabla 3.- Edad de Encuestados Porcentaje: % = fi * 100


Frecuencia Frecuencia
Edad ni fi % Variable Porcentaje
absoluta Relativa
x %
9 4 0,4 40 ni fi
10 3 0,3 30 x1 n1 f1 f1 *100
11 3 0,3 30 x2 n2 f2 f2 *100
TOTAL 10 1 100 ⋮ ⋮ ⋮ ⋮
xk nk fk fk *100
Fuente: Datos imaginarios
TOTAL n 1 100

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

A medida que crece el rango de valores de la variable, el número de


de las filas de la tabla aumenta, en tal sentido, es necesario
condensar los datos para disminuir las filas, es así como se generan las
tablas de frecuencias para datos agrupados.

Ejemplo.- La edad de las personas en el rango de los 6 a 60 años

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

1.- Cálculo del alcance de la Variable


alcance = (Valor máximo – Valor mínimo)
2.- Determinación del número de clases o cantidad de intervalos
El número de clases debe estar entre 5 y 15 (Se sugiere)
Está ligado a la raíz del número de datos sqrt(N)
3.- Determinar el ancho de los intervalos de clase. Siempre que sea
posible se debe tratar de obtener clases con el mismo ancho (se
recomienda que el valor sea entero).
Ancho del intervalo = alcance / Número de clases

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

4.- hallar los límites aparentes de cada clase


Para la primera clase
alcance = (Valor máximo – Valor mínimo)
LI = puntaje mínimo
LS = puntaje mínimo + ancho del intervalo
Para los demás
alcance = (Valor máximo – Valor mínimo)
LI = LI anterior + ancho del intervalo
LS = LS anterior + ancho del intervalo
5.- Toda clase posse un punto medio Xi
Xi = (Lli + LSi) / 2

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

Edad

30 30 19 18 20 21 20 19

27 25 28 23 25 32 35 26

27 28 27 22 30 28 27 28

35 34 35 25 20 30 32 29

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

1.- Cálculo del alcance o rango de la Variable


alcance = (35 – 18) = 17
u = unidad de medida
2.- Determinación del número de clases
El número de clases = sqrt(17) = 4.12 >>> 4
3.- Determinar el ancho de los intervalos de clase. Siempre que sea
posible se debe tratar de obtener clases con el mismo ancho (se
recomienda que el valor sea entero).
Ancho del intervalo = 17 / 4 = 4.25

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

4.- hallar los límites de cada clase


Para la primera clase
LI1 = 18
LS1 = 18 + 4.25 =22.25
Para los demás
LI2 = 18+4.25= 22.25 LS2= 22.25 + 4.25=26.5
LI3 = 22.25 + 4.25=26.5 LS3= 26.5 + 4.25=30.75
LI4 = 26.5 + 4.25=30.75. LS4= 30.75 + 4.25=35

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase

Edad Xi ni fi % Ni Fi %A

18 - 22.25 20.125 8 0.25 25 8 0.25 25


0.406
22.25. - 26.5 24.375 5 0.15625 15.625 13 40.625
25
0.812
26.5. – 30.75 28.625 13 0.40625 40.625 26 81.25
5

30.75 - 35 32.875 6 0.1875 18.75 32 1 100

TOTAL 32 1 100

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Tabla de Frecuencias para distribución estadística con clase
Frecuenci Frecuencia Frecuencia Frecuencia
Variable Punto Frecuenci Frecuencia
a Absoluta Relativa relativa en %
Cuantitativa Medio a Relativa relativa en %
Absoluta Acumulada Acumulada Acumulada

LI - LS Xi ni fi % Ni Fi %A

LI1 LS1 X1 n1 f1 % f1 N1 = n 1 F1 = f1 F1 *100

F2 = F1 + f2
LI2 LS2 X2 n2 f2 %f2 N2 = N1 + n2 F2 *100

⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

LIk LSk Xk nk fk % fk Nk = Nk-1 + nn Fk = Fk-1 + fn Fk *100

TOTAL N 1 100%

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.a Organización de datos
Ejercicio en Excel

Realizar un análisis de distribución estadística con y sin clase para los


siguientes porcentajes de grasa encontrados en un alimento
especifico en diferentes muestras.

34, 45, 34, 54, 34, 32, 35, 50, 45, 50, 45

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos

Parámetros
Estadísticos

Posición Dispersión Forma

Central No central Rango Rango desviación desviación


varianza
intercuantílico media típica

Coeficiente Coeficiente de
Media Mediana Moda Cuartiles Deciles Percentiles de asimetrÍa apuntamiento

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
INDICADORES NUMERICOS
VARIABLES CUANTITATIVAS VARIABLES CUALITATIVAS
• Medidas de tendencia central (media, • Medidas de tendencia central (moda)
mediana, moda) • Porcentajes
• Medidas de dispersión
• (varianza, desviación estándar, rango,
coeficiente de variación)
• Medidas de posición no central
(percentiles)
• Medidas de forma (asimetría y curtosis)

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
INDICADORES NUMERICOS
MEDIDAS DIMENSIONALES Medidas adimensionales
• Medidas de tendencia central (media, • Medidas de dispersión (varianza,
mediana, moda) coeficiente de variación)
• Medidas de dispersión (desviación • Medidas de posición no central
estándar, rango) (percentiles)
• Medidas de forma (asimetría y curtosis)

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
MEDIA ARITMÉTICA

La media de una variable X se denota por x , y se calcula


como se indica a continuación. Dado un conjunto de datos
numéricos x1, x2, …, xn, la media no es más que la suma de
todos los datos dividido por el número total de valores:
N

x
i 1
i
x
N

NOTA: Se usa solamente para variable aleatorias continuas


Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
MEDIANA

La mediana es un valor de la variable que deja por debajo


de sí a la mitad de los datos, una vez que estos están
ordenados de menor a mayor. La mediana se denota por
Me y se calcula de manera sencilla. Ordenados los datos de
menor a mayor, Me es:

- Número de datos impares N 1


2
N N
- Número de datos pares (2 datos) 2
1
2
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
MEDIANA
Por ejemplo: Sea la variable aleatoria “números de televisores por
hogar”. Se realiza una encuesta en 13 hogares, obteniéndose los
siguientes resultados:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1
Hallar la mediana de los mismos.

El primer paso es ordenar los datos de menor a mayor:


1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4
Como n es 13, impar, Me será igual a 2, de manera que queden 6
datos por debajo y 6 por encima de dicha posición.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
MODA

La moda, representada por Mo, es otro parámetro de posición que se


calcula simplemente como el valor que más se repite en la muestra, es
decir, el valor con una mayor frecuencia. En consecuencia, no siempre
se sitúa hacia el centro de la distribución.

Puede haber más de una moda en el caso en que dos o más valores
de la variable presenten la misma frecuencia. Por otro lado, la moda
puede no existir cuando en un conjunto de datos, todos éstos son
diferentes entre sí y no hay ningún dato que se repita más de una vez.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
MEDIDAS DE POSICION NO CENTRAL

Se trata de valores de la variable estadística que dejan por debajo de sí


determinada cantidad de los datos. Mientras que la mediana deja por
debajo de sí al 50% de la distribución, los cuantiles pueden hacerlo con
cualquier otro porcentaje. Los más frecuentemente utilizados son
cuartiles, si se divide la cantidad de datos en cuatro partes.

PRIMER CUARTIL C1. Valor que deja por debajo el 25% de los datos y por encima el 75%
de los datos.
SEGUNDO CUARTIL C2. Coincide con la mediana. Deja el 50% de los valores por
debajo y por encima.
TERCER CUARTIL C3. Valor que deja por debajo el 75% de los datos y por encima el 25%
de los datos
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
MEDIDAS DE POSICION NO CENTRAL
Para calcular C1 y C3, ordenados los datos de menor a mayor, se
procede de la siguiente forma:
Cuando N es par: Cuando N es impar:
N 1
C1 = mediana de N/2 primeros datos Opción 1 es impar
2
C3 = mediana de N/2 últimos datos C1 = mediana de N-1/2 primeros datos
C3 = mediana de N-1/2 últimos datos
N 1
Opción 1 es par
2
C1 = mediana de los primeros N-1/2 + C2 datos
C3 = mediana de los segundos N-1/2 + C2 datos

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
CUARTILES
EJEMPLO: Los siguientes datos muestran el número de despedidos que
se han producido en 15 empresas del sector del automóvil durante el
año 2010:
33 56 91 64 55 60 2 42 32 26 63 40 25 34 84

Hallar los cuartiles.

El primer paso es ordenar los datos de menor a mayor:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 25 26 32 33 34 40 42 55 56 60 63 64 84 91

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 25 26 32 33 34 40 42 55 56 60 63 64 84 91

Se trata de un número impar de datos. Por la tanto, la mediana es el


valor central siendo:

= = 8 = C2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 25 26 32 33 34 40 42 55 56 60 63 64 84 91

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 25 26 32 33 34 40 42 55 56 60 63 64 84 91

Para el primer y el tercer cuartil, tenemos que N es impar (15) y que


(N-1)/2 = 7 es impar

C1 = media de los primeros 7 C3 = media de los últimos 7 datos.


datos. Entonces, C1 sería el dato Entonces, C3 sería el dato 12 = 63
4 = 32

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 25 26 32 33 34 40 42 55 56 60 63 64 84 91
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Rango

Es la medida de dispersión más sencilla de calcular. Es la diferencia


entre el mayor y el menor valor que toma la variable. Es una medida
poco precisa ya que sólo toma en consideración un par de
observaciones y puede verse afectada por valores extremos.

Por ejemplo: Hallar el rango de los datos 2, 9, 8, 9, 15, 21, 5, 20.

El Rango quedaría 21-2=19.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Varianza y Desviación típica

Es medida de dispersión que se utiliza para representar la variabilidad


de un conjunto de datos respecto de la media aritmética de los
mismos. N
 x i  x 
2
i 1
S2 
N 1
Donde x es el valor de la media aritmética y Xi es el valor de cada dato

La desviación estándar S, es la raíz cuadrada de la varianza:


N

 x i  x
2

S i 1

N 1
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Varianza y Desviación típica

Por ejemplo: Hallar la varianza y desviación típica o estándar de los


datos 2, 9, 8, 15, 21, 5, 20

S2= 49.18; S=6.82

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Coeficiente de Variación de Pearson

Se define como cociente entre la desviación típica y la media:


S
CV 
x
Se interpreta como el número de veces que la media está contenida
en la desviación estándar. Suele darse su valor en tanto por ciento,
multiplicando el resultado anterior por 100. De este modo se obtiene un
porcentaje de la variabilidad.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Parámetros de forma

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Coeficiente de Asimetría

Las medidas de asimetría permiten conocer si los datos están dispuestos


de forma simétrica en torno a un valor central de posición, que
generalmente es la media aritmética y viene representada por el
Coeficiente de Asimetría

N

 ix  x 3

CA  i 1
( N  1)·S 3

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Coeficiente de Asimetría

Las medidas de asimetría permiten conocer si los datos están dispuestos


de forma simétrica en torno a un valor central de posición, que
generalmente es la media aritmética y viene representada por el
Coeficiente de Asimetría

N

 ix  x 3

CA  i 1
( N  1)·S 3

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Coeficiente de Asimetría

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Coeficiente de Curtosis o Apuntamiento

se pretende medir cómo se reparten las frecuencias relativas de los


datos entre el centro y los extremos, tomando como comparación la
campana de Gauss. Miden si los valores se concentran más o menos
frecuentemente en torno a la media respecto de lo que cabría esperar
en una distribución normal
N
 x i  x 
4
i 1
CC 
( N  1)·S 4

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Coeficiente de Curtosis o Apuntamiento

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Representaciones Cuantitativas
• Diagrama de caja
• Histograma
• Diagrama de dispersión
• Gráfico de probabilidad normal

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos
Variables Cualitativas
• Diagrama de sectores
• Diagrama de barras

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.1.b Principales parámetros estadísticos

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades

Experimento Aleatorio
Son aquellos experimentos en los que no se puede predecir el
resultado.

• Lanzamiento de una moneda al aire


• Lanzamiento de un dado
• Seleccionar una carta de una baraja
• Extraer una bola de cierto color

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Experimento de lanzamiento de una moneda

Cara

Sello
2
𝑃 3 𝑜 6 = = 33.33%
6
Regla de Laplace
0
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑞𝑢𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒𝑛 𝑚𝑖𝑠 𝑐𝑜𝑛𝑑𝑖𝑐𝑖𝑜𝑛𝑒𝑠 𝑃 3 𝑦 6 = = 0%
𝑃(𝐴) = 6
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
3
1 𝑃 𝑝𝑎𝑟 = = 50%
𝑃 𝐴 = = 50% 6
2
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades

Espacio Muestral: S - Ω
Es el conjunto de todos los resultados posibles de un experimento
aleatorio.

• Lanzamiento de una moneda al aire


S={Cara,Cruz} ={C,X}
• Lanzamiento de un dado
S ={1, 2, 3, 4, 5, 6}
• Seleccionar una carta de una baraja
S ={1C, 2C, …, rC, RC, 1T, 2T,…, }. Debe ir los 52 elementos
• Extraer una bola de cierto color ( 2 blancas, 3 azules, 4 rojas)
S ={b1, b2, a1, a2, a3, r1, r2, r3, r4 }.
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades

Evento o Suceso
Uno o varios posibles resultados

• Lanzamiento de una moneda al aire


A= que caiga cara o cruz A= {C}.
• Lanzamiento de un dado
B= que caiga un múltiplo de 2. B= {2, 4, 6}.
• Seleccionar una carta de una baraja
C= carta que sea de corazones
• Extraer una bola de cierto color ( 2 blancas, 3 azules, 4 rojas)
D= sacar una moneda blanca y una azul

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades

Experimento sobre lanzamiento de 2 Monedas

Espacio Muestral C=CARA; X=CRUZ


• S= {CC, CX, XC, XX}.
Cara
Elementos de un evento
• A= la primera caiga en cara
• A= {CC, CX}. Tiene dos elementos

CRUZ

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades

EJEMPLO: En una urna hay 4 bolas rojas, 2 azules, y 1 amarilla


¿Cuál es la probabilidad de
4
1.- Sacar una bola roja? 7
= 57,14%

2
2.- Sacar una bola azul? 7
= 28.6%

3.- Sacar una bola negra? 0%

3
4.- Sacar una bola amarilla o azul? 7
= 42,9%

# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑞𝑢𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒𝑛 𝑚𝑖𝑠 𝑐𝑜𝑛𝑑𝑖𝑐𝑖𝑜𝑛𝑒𝑠


𝑃(𝐴) =
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades E espacio muestral
SUCESOS
• Cuando se realiza un experimento aleatorio diversos resultados son
posibles. El conjunto de todos los resultados posibles se llama
espacio muestral (E).
• Se llama suceso a un subconjunto de dichos resultados.
• Se llama suceso contrario (complementario) de un suceso A, A’, al
formado por los elementos que no están en A E espacio muestral
• Se llama suceso unión de A y B, AUB, al formado por los resultados
experimentales que están en A o en B (incluyendo los que están en A
ambos. A’
• Se llama suceso intersección de A y B, A∩B o simplemente AB, al
formado por los elementos que están en A y B

E espacio muestral E espacio muestral E espacio muestral


UNIÓN INTERS.
A A A

B B B

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
• Se llama probabilidad a cualquier función, P, que
asigna a cada suceso A un valor numérico P(A),
verificando las siguientes reglas (axiomas)
E espacio muestral
• P(E)=1
100%

E espacio muestral

• 0≤P(A) ≤1 A
B
• P(AUB)=P(A)+P(B) si A∩B=Ø
• Ø es el conjunto vacío.

• Podemos imaginar la probabilidad de un subconjunto


como el tamaño relativo con respecto al total (suceso
seguro)
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
P(A)=3/9=1/3
P(A)=?
E espacio muestral
P(B)=5/9P(B)=?
A P(AUB)=6/9=2/3
P(AUB)=?
P(AB)=?
P(AB)=2/9 P(A)=3/9=1/3
P(A)=?
B P(A’)=?
P(A’)=6/9=2/3 E espacio muestral
P(B)=2/9P(B)=?
P(B’)=4/9
P(B’)=? A
P(AUB)=3/9=1/3
P(AUB)=?
B
P(AB)=2/9
P(AB)=?
E espacio muestral
P(A)=3/9=1/3
P(A)=? P(A’)=?
P(A’)=6/9=2/3
P(B)=2/9P(B)=? P(B’)=7/9
P(B’)=?
A P(AUB)=5/9
P(AUB)=?
B
P(AB)=0P(AB)=?
P(A’)=6/9=2/3
P(A’)=?
P(B’)=7/9
P(B’)=?

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Probabilidad condicionada
• Se llama probabilidad de A condicionada a B, o
probabilidad de A sabiendo que pasa B:
E espacio muestral

P(AÇ B)
P(A | B)  A
P(B) B

 Error frecuentíiiiiiisimo:
 No confundir probabilidad condicionada con intersección.
 En ambos medimos efectivamente la intersección, pero…
 En P(A∩B) con respecto a P(E)=1
 En P(A|B) con respecto a P(B)
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
A A

B
B

P(A) = 0,25 P(A) = 0,25


P(B) = 0,10 P(B) = 0,10
P(A∩B) = 0,10 P(A∩B) = 0,08

¿Probabilidad de A sabiendo que ha pasado B?


P(A|B)=1 P(A|B)=0,8
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
A A

B
B

P(A) = 0,25 P(A) = 0,25


P(B) = 0,10 P(B) = 0,10
P(A∩B) = 0,005 P(A∩B) = 0
¿Probabilidad de A sabiendo que ha pasado B?
P(A|B)=0,05 P(A|B)=0
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Algunas reglas de cálculo prácticas
• Cualquier problema de probabilidad puede resolverse en teoría
mediante aplicación de los axiomas. Sin embargo, es más cómodo
conocer algunas reglas de cálculo:

• P(A’) = 1 - P(A)

• P(AUB) = P(A) + P(B) - P(AB)

• P(AB) = P(A) P(B|A)


= P(B) P(A|B)

• Prob. de que pasen A y B es la prob. de A y que también pase B


sabiendo que pasó A.
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo (I) Recuento
MENOPAUSIA
NO SI Total
CLASIFICACION NORMAL 189 280 469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• Se ha repetido en 1000 ocasiones el experimento de elegir a una mujer de una población


muy grande. El resultado está en la tabla.

• ¿Cuál es la probabilidad de que una mujer tenga osteoporosis?


• P(Osteoporosis)=64/1000=0,064=6,4%
• Noción frecuentista de probabilidad

• ¿Cuál es la probabilidad de que una mujer no tenga osteoporosis?


• P(No Osteoporosis)=1-P(Osteoporsis)=1-64/1000=0,936=93,6%
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades Recuento
MENOPAUSIA
NO SI Total
Ejemplo (II) CLASIFICACION
OMS
NORMAL
OSTEOPENIA
189
108
280
359
469
467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• ¿Probabilidad de tener osteopenia u osteoporosis?


• P(OsteopeniaUOsteoporo)=P(Osteopenia)+P(Osteoporo)-P(Osteopenia∩Osteoporo)
=467/1000+64/1000=0,531
• Son sucesos disjuntos
• Osteopenia ∩ Osteoporosis=Ø

• ¿Probabilidad de tener osteoporosis o menopausia?


• P(OsteoporoUMenopaus)=P(Osteoporo)+P(Menopaus)-P(Osteoporo∩ Menopaus)
=64/1000+697/1000-58/1000=0,703
• No son sucesos disjuntos
• ¿Probabilidad de una mujer normal?
• P(Normal)=469/1000=0,469
• P(Normal)=1-P(Normal’)=1-P(OsteopeniaUOsteoporo) =1-0,531=0,469
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades Recuento
MENOPAUSIA

Ejemplo (III)
NO SI Total
CLASIFICACION NORMAL 189 280 469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• Si es menopáusica… ¿probabilidad de osteoporosis?


• P(Osteoporosis|Menopausia)=58/697=0,083

• ¿Probabilidad de menopausia y osteoporosis?


• P(Menop ∩ Osteoporosis) = 58/1000=0,058

• Otra forma:
P ( Menop  Osteoporos is )  P ( Menop )  P (Osteoporos is | Menop ) 
697 58
   58 / 1000  0,058
1000 697
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo (III) Recuento
MENOPAUSIA
NO SI Total
CLASIFICACION NORMAL 189 280 469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• Si tiene osteoporosis… ¿probabilidad de menopausia?


• P(Menopausia|Osteoporosis)=58/64=0,906

• ¿Probabilidad de menopausia y no osteoporosis?


• P(Menop ∩ No Osteoporosis) = 639/1000=0,639

• Si no tiene osteoporosis… ¿probabilidad de no menopausia?


• P(No Menopausia|NoOsteoporosis)=297/936=0,317

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Independencia de sucesos
• Dos sucesos son independientes si el que ocurra
uno, no añade información sobre el otro.

• A es independiente de B

 P(A|B) = P(A)

 P(AB) = P(A) P(B)

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades Recuento
MENOPAUSIA
Ejemplo (III) NO SI Total
CLASIFICACION NORMAL 189 280 469
OMS OSTEOPENIA 108 359 467
OSTEOPOROSIS 6 58 64
Total 303 697 1000

• ¿Son independientes menopausia y osteoporosis?


• Una forma de hacerlo
• P(Osteoporosis)=64/1000=0,064
• P(Osteoporosis|Menopausia)=58/697=0,098
• La probabilidad de tener osteoporosis es mayor si ha pasado la
menopausia. Añade información extra. ¡No son independientes!

• ¿Otra forma?
• P(Menop ∩ Osteoporosis) = 58/1000 = 0,058
• P(Menop) P(Osteoporosis)= (697/1000) x (64/1000) = 0,045
• La probabilidad de la intersección no es el producto de
probabilidades. No son independientes.
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Sistema exhaustivo y excluyente de sucesos
Son una colección de sucesos
A1 A2
A1, A2, A3, A4…

Tales que la unión de todos ellos forman


el espacio muestral, y sus intersecciones
son disjuntas.

¿Recuerdas cómo formar intervalos en tablas de


frecuencias? A 1

A3 A4
A2
Suceso
seguro
A3

Maestría en Ingeniería en Seguridad Industrial


A4
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Divide y vencerás Todo suceso B, puede ser
descompuesto en componentes de
A1 A2 dicho sistema.

B = (B∩A1) U (B∩A2 ) U ( B∩A3 ) U ( B∩A4 )

B
A1 B

A2 B
A3 A4 Suceso
seguro
A3 B
Nos permite descomponer el problema B en
subproblemas más simples. Creeme . Funciona. A4 B
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Teorema de la probabilidad total
Si conocemos la probabilidad de B en cada uno de los
A1 A2 componentes de un sistema exhaustivo y excluyente de
sucesos, entonces…

… podemos calcular la probabilidad de B.


P(B|A1)
B A1 B
P(A1)
P(B|A2)
A2 B
Suceso P(A2)
A3 A4 seguro P(B|A3)
P(A3) A3 B
P(A4) P(B|A4)
P(B) = P(B∩A1) + P(B∩A2 ) + P( B∩A3 ) + P( B∩A4 ) A4 B

=P(A1) P(B|A1) + P(A2) P(B|A2)+ …


Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo I: En esta aula el 70% de los alumnos son mujeres. De ellas
el 10% son casadas. De los hombres, son casados el 20%.
T. Prob. Total. Casada
Hombres y mujeres forman un sist. Exh. Excl. de sucesos 0,1

Mujer
0,9
• ¿Qué porcentaje de casados hay? 0,7
Soltera
P(C) = P(M∩C) + P(H∩C) Estudiante
= P(M)P(C|M) + P(H)P(C|H)
0,3 0,2
= 0,7 x 0,1 + 0,3 x 0,2 Casado
Hombre
= 0,13 =13%
•Los caminos a través de nodos representan intersecciones. 0,8
Soltero
•Las bifurcaciones representan uniones disjuntas.
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo II: En la UNACH hay dos Laboratorios para realizar
análisis de la calidad del agua. El 1º se usa el 75% de veces
para el análisis. En el 1º la frec. de infección de la muestra es
del 5% y en el 2º del 10%.
Infec
0,05
• ¿Qué probabilidad de infección hay?
• P(I) = P(L1∩I) + P(L2∩I) L1
0,75 0,95
= P(L1)P(I|L1) + P(L2)P(I|L2) No infec

=0,75 x 0,05 + 0,25 x 0,1 Muestra

= 0,0625 0,25 0,1


Infec
L2

T. Prob. Total. 0,9


Los dos laboratorios forman un sist. Exh. Excl. de sucesos No infec
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo III: El 20% del tiempo que se está en una casa transcurre en la cocina, el
10% en el baño y el resto entre el salón y el dormitorio. Por otro lado la
probabilidad de tener un accidente doméstico estando en la cocina es de 0,30
de tenerlo estando en el baño es de 0,20 y de tenerlo fuera de ambos de 0,10.
¿Cuál es la probabilidad de tener un accidente doméstico?

Acc
0,30

No Acc P(A) = P(A∩C) + P(A∩B) + P(A∩R)


Cocina
0,20 0,70
= P(C)P(A|C) + P(B)P(A|B) + P(R)P(A|R)
Acc
0,20 =0,2 x 0,3 + 0,1 x 0,2 + 0,7 x 0,1
0,10
Casa Baño No Acc
= 0,15 = 15%
0,80

0,70 0,10 Acc


Resto
No Acc
0,90

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Teorema de Bayes
A1 A2 Si conocemos la probabilidad de B en cada uno de
los componentes de un sistema exhaustivo y
excluyente de sucesos, entonces…

…si ocurre B, podemos calcular la probabilidad (a


posteriori) de ocurrencia de cada Ai.
B

P(B Ai)
P(Ai| B) 
A3 A4 P(B)
donde P(B) se puede calcular usando el teorema de la probabilidad total:

P(B)=P(B∩A1) + P(B∩A2 ) + P( B∩A3 ) + ( B∩A4 )

=P(B|A1) P(A1) + P(B|A2) P(A2) + …


Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo IV: En este aula el 70% de los alumnos son mujeres. De ellas el 10% son
casadas. De los varones, son casados el 20%.

• ¿Qué porcentaje de casados hay?


• P(F) = =0,7 x 0,1 + 0,3 x 0,2 = 0,13 Casada
• (Resuelto antes) 0,1

• Se elije a un individuo al azar y es… casado 0,7 Mujer


0,9
¿Probabilidad de que sea un hombre?
Soltera

P( H Ç C
F ) P( H )  P(C
F | H) Estudiante
F) 
P( H | C  
P (C
F) P( FC) 0,2
0,3 Casada
0,3  0,2 Hombre
  0,46
0,13
0,8
Maestría en Ingeniería en Seguridad Industrial
Soltera
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo (V): En la UNACH hay dos Laboratorios para realizar análisis de
la calidad del agua. El 1º se usa el 75% de veces para el análisis. En el
1º la frec. de infección de la muestra es del 5% y en el 2º del 10%.

• ¿Qué probabilidad de infección hay? P(I) = 0,0625


Infec
• Se ha producido una infección. 0,05
¿Qué probabilidad hay de que sea en el L1?
L1
0,75 0,95
No infec
P(QL1 Ç I ) P(Q
L1)  P ( I | Q
L1)
L1 | I ) 
P (Q   Muestra
P( I ) P( I )
0,75  0,05 0,25 0,1
  0,6 Infec
0,0625 L2

0,9
Maestría en Ingeniería en Seguridad Industrial No infec
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo (VI): El 20% del tiempo que se está en una casa transcurre
en la cocina, el 10% en el baño y el resto entre el salón y el
dormitorio. Por otro lado la probabilidad de tener un accidente
doméstico estando en la cocina es de 0,30 de tenerlo estando en el
baño es de 0,20 y de tenerlo fuera de ambos de 0,10. Se ha
producido un accidente, ¿cuál es la probabilidad de que haya sido
en la cocina? P(A) = 0,15 (ya calculado)
Acc
0,30

P (C Ç A) P (C )  P ( A | C )
0,20
Cocina
0,70
No Acc
P (C | A)   
P ( A) P( A)
Acc
0,20  0,30
0,10
0,20
  0,4
Casa Baño No Acc 0,15
0,80

0,70 0,10 Acc


Resto
No Acc

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Ejemplo de prueba diagnósticas: Diabetes
• Los carbohidratos ingeridos terminan como glucosa en la sangre. El exceso se
transforma en glucógeno y se almacena en hígado y músculos. Este se transforma entre
comidas de nuevo en glucosa según necesidades.
• La principal hormona que regula su concentración es la insulina. La diabetes provoca
su deficiencia o bien la insensibilidad del organismo a su presencia. Es una enfermedad
muy común que afecta al 2% de la población (prevalencia)
• Una prueba común para diagnosticar la diabetes, consiste en medir el nivel de glucosa.
En individuos sanos suele variar entre 64 y 110mg/dL.
• El cambio de color de un indicador al contacto con la orina suele usarse como
indicador (resultado del test positivo)

• Valores por encima de 110 mg/dL se asocian con un posible estado pre-diabético.
• Pero no es seguro. Otras causas podrían ser: hipertiroidismo, cancer de páncreas,
pancreatitis, atracón reciente de comida…
• Supongamos que los enfermos de diabetes, tienen un valor medio de 126mg/dL.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Funcionamiento de la prueba diagnóstica de glucemia
• Valor límite: 110mg/dL
• Superior: test positivo.
• Inferior: test negativo.

• Probabilidad de acierto:
• Para enfermos
• Verdadero positivo
(sensibilidad)
• Para sanos
• Verdadero negativo
(especificidad)

• Probabilidad de error
• Para enfermos
• Falso –
• Para sanos
Maestría en Ingeniería en Seguridad Industrial
• Falso +
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
¿Cómo definir el punto de corte de la prueba diagnóstica?

No es simple. No es posible aumentar sensibilidad y especificidad al mismo tiempo. Hay que


elegir una solución de compromiso: Aceptable sensibilidad y especificidad.
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Una prueba diagnóstica ayuda a mejorar una estimación de la probabilidad de que un
individuo presente una enfermedad.

• En pricipio tenemos una idea subjetiva de P(Enfermo). Nos ayudamos de…


• Incidencia: Porcentaje de nuevos casos de la enfermedad en la población.
• Prevalencia: Porcentaje de la población que presenta una enfermedad.

• Para confirmar la sospecha, usamos una prueba diagnóstica. Ha sido evaluada con
anterioridad sobre dos grupos de individuos: sanos y enfermos. Así de modo frecuentista
se ha estimado:
• P(+ | Enfermo)= Sensibilidad (verdaderos +)= Tasa de acierto sobre enfermos.
• P(- | Sano) = Especificidad (verdaderos -)= Tasa de acierto sobre sanos.

• A partir de lo anterior y usando el teorema de Bayes, podemos calcular las


probabilidades a posteriori (en función de los resultados del test): Índices predictivos
• P(Enfermo | +) = Índice predictivo positivo
• P(Sano | -) = Índice predictivo negativo
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
Pruebas diagnósticas: aplicación T. Bayes.
Sensibilidad, T+
verdaderos +
P. a priori de enfermedad:
incid., preval., intuición,… Enfermo

Falsos - T-
Individuo
Falsos +
T+
Sano

Especificidad, T-
Verdaderos -
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades Individuo
Ejemplo: Índices predictivos
0,98 0,02
• La diabetes afecta al 2% de
los individuos.
• La presencia de glucosuria
se usa como indicador de
diabetes.
• Su sensibilidad es de 0,945.
• La especificidad de 0,977. 0,055 0,945
• Calcular los índices 0,977 0,023
predictivos.

T+ T- T+
T-
P(Sano T ) P(Sano)P(T  | Sano) P(Enf T ) P(Enf )P(T  | Enf )
P(Sano| T )   P(Enf | T )  
P(T ) P(Sano)P(T  | Sano)  P(Enf )P(T  | Enf ) P(T ) P(Sano)P(T  | Sano)  P(Enf )P(T  | Enf )
0,98 0,977 0,02 0,945
  0,999   0,456
0,98 0,977 0,02 0,055 0,02 0,945 0,98 0,023
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
-¿Qué probabilidad
Observaciones tengo de estar
enfermo?
• En el ejemplo anterior, al llegar un individuo a
la consulta tenemos una idea a priori sobre la - En principio un 2%. Le
probabilidad de que tenga una enfermedad. haremos unas pruebas.

• A continuación se le pasa una prueba


diagnóstica que nos aportará nueva
información: Presenta glucosuria o no.

• En función del resultado tenemos una nueva


idea (a posteriori) sobre la probabilidad de
que esté enfermo. - Presenta glucosuria. La
probabilidad ahora es
• Nuestra opinión a priori ha sido modificada del 45,6%.
por el resultado de un experimento.

Maestría en Ingeniería en Seguridad Industrial


con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
1.1.2 Probabilidades
• Álgebra de sucesos ¿Qué hemos visto?
• Unión, intersección, complemento
• Probabilidad
• Nociones
• Frecuentista
• Subjetiva o Bayesiana
• Axiomas
• Probabilidad condicionada
• Reglas de cálculo
• Complementario, Unión, Intersección
• Independencia de sucesos
• Sistema exhaustivo y excluyente de sucesos
• Teorema probabilidad total.
• Teorema de Bayes
• Pruebas diagnósticas
• A priori: Incidencia, prevalencia.
• Eficacia de la prueba: Sensibilidad, especificidad.
• A posteriori: Índices predictivos.
Maestría en Ingeniería en Seguridad Industrial
con mención en Prevención de Riesgos Laborales
Análisis estadísticos de Datos 1. Introducción a la Estadística
Más información:
[email protected]

También podría gustarte