0% encontró este documento útil (0 votos)
210 vistas12 páginas

Curva Normal y Distribución de Probabilidad

Este documento explica la distribución normal y cómo calcular probabilidades bajo esta distribución. Introduce la curva normal y cómo representa los datos cuando se agrupan alrededor de un valor central. Explica cómo convertir valores de datos en valores z para calcular áreas bajo la curva normal usando tablas de puntuaciones z. Proporciona un ejemplo calculando la probabilidad de que una persona tenga una edad entre 38 y 69 años usando esta metodología.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
210 vistas12 páginas

Curva Normal y Distribución de Probabilidad

Este documento explica la distribución normal y cómo calcular probabilidades bajo esta distribución. Introduce la curva normal y cómo representa los datos cuando se agrupan alrededor de un valor central. Explica cómo convertir valores de datos en valores z para calcular áreas bajo la curva normal usando tablas de puntuaciones z. Proporciona un ejemplo calculando la probabilidad de que una persona tenga una edad entre 38 y 69 años usando esta metodología.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

1.

Distribución normal

1.1 Curva normal

En la unidad número 1 aprendimos a dibujar el polígono de frecuencias y en la unidad


dos vimos porqué hay polígonos sesgados ya sea a la izquierda o la derecha y que
característica son necesarias para que el polígono sea simétrico.
A continuación se muestra el polígono que se obtuvo del conjunto de datos de las
edades de los usuarios de un servicio social:

Si a este polígono se le aplica una mayor cantidad de puntos para poder dibujarlo con
más precisión finalmente se suavizaría y la línea roja terminaría tomando forma de
curva viéndose como en el gráfico siguiente:

A esta gráfica se le llama de varias formas:


• Curva Normal
• Distribución Normal
• Curva de la Campana

2 | e-Learning
• Curva Simétrica
• Campana de Gauss

Recordemos que nuestro gráfico original lo obtuvimos de un conjunto de datos sobre


edades de personas que asisten a un servicio social y después de aplicarle la
organización de datos pudimos obtener la forma que estos generan, la gran mayoría de
experimentos generan curvas normales, es por esa razón que se llama normal, pues lo
“más normal” en cualquier conjunto de datos es que su representación gráfica sea una
curva normal, esto es porque los datos de la mayoría de experimentos tienden a un
mismo valor central representativo del conjunto, este valor es la Media, y recordemos
por ser simétrica la curva, la Mediana y la Moda tienen el mismo valor de la Media o
muy próxima a ella.

Se presenta a continuación nuevamente el gráfico de “Participantes de Programa de


Servicio Social” pero suavizado:

Observaciones:
• Los extremos de la curva en realidad nunca llegan a tocar el eje de las x sino que
se extiende hacia los infinitos tanto positivo como negativo.
• Pero para fines prácticos el valor de “x menor” es donde ya empieza a generar
área bajo la curva y termina en el “x mayor”, que para nuestro caso son 38 y 99
años respectivamente.
• Vemos que el valor de la media está al centro de la curva.
• Esta curva está representando ahora una “Distribución de Probabilidad”.

1.2 Distribución de probabilidad


Tal y como se señaló en la última observación de la sección anterior, la curva normal es
utilizada para representar la distribución de probabilidad, es decir el área que se

3 | e-Learning
encuentra por debajo de la curva normal, representa una distribución de probabilidad,
tal y como se muestra en el siguiente gráfico de un caso general:

Observaciones:
• El eje de las “y” ahora representa densidad de probabilidad, ya no representa
la frecuencia.
• El eje de las “x” sigue siendo valores de x y nos indica para este caso en
particular la que Media vale cero, pero para cualquier otro experimento el valor
de x al centro de la curva será el valor de la Media que tengan los datos.
• El área bajo la curva se ha coloreado de celeste y representa la distribución de
probabilidad, que por ser toda el área bajo la curva la que está sombreada el
valor de probabilidad es 1 (esto se explica con mayor detalle a continuación).

Ahora regresando a los datos de los participantes del programa de servicio social,
podríamos preguntarnos, ¿cuál es la probabilidad de escoger al azar a una persona que
tenga entre 38 y 99 años?, como sabemos que todos los participantes están entre esas
edades, es seguro que escogeremos a una persona que esté entre esas edades y por lo
tanto la probabilidad es igual a 1, es decir P(entre 38 y 99) = 1 y lo representamos
sombreando azul toda el área bajo la curva tal y como lo mencionamos anteriormente:

Ahora podríamos plantearnos otra pregunta, ¿cuál es la probabilidad de escoger a una


persona entre los 38 y los 69 años?, lo representamos gráficamente y nos podemos dar
cuenta que es la mitad de la población:
4 | e-Learning
Entonces la distribución de la probabilidad va a ir desde x = 38 hasta x = 69 quedando
así:

Como podemos ver la probabilidad es el 50% de la gráfica, dividiéndolo dentro de 100


nos queda que la probabilidad es igual a 0.5, es decir P(38 a 69) = 0.5

Ahora bien que sucede si nos piden la probabilidad de escoger a alguien entre los 38 y
los 55 años, como se muestra abajo:

Como x = 55 no representa ninguna frontera en especial, necesitamos recurrir a la


técnica para calcular áreas bajo una curva, esto se hace a través de un cálculo de
matemática integral, pero en estadística general se acostumbra en vez de ello a utilizar

5 | e-Learning
una tabla que provee valores de área bajo la curva en base a valores de z, procedimiento
que veremos a continuación.

1.3 Valores de “z”


Debido a que se pueden realizar infinita cantidad de experimentos en estadística, los
valores de x pueden representar infinita cantidad de dimensionales, es decir para
nuestro ejemplo x es igual a edades, pero ya vimos otro ejemplo donde x es velocidad
y por consiguiente tiene otros rangos de valores, entonces x puede ser cualquier cosa,
dinero, galones, unidades, libras, personas, votos, y un etc. infinito, por lo cual se vuelve
necesario homologar los diferentes valores de x hacia un valor estándar adimensional
que llamaremos “z”.

Para convertir valores de x en z usaremos la siguiente fórmula:

𝑥−𝑀
𝑧=
𝑆
Donde:
• x = valor de x que queremos convertir en z
• M = media
• S = Desviación estándar

Entonces siguiendo con nuestro ejemplo donde queremos saber la probabilidad de


escoger a una persona entre los 38 y los 55 años, primero necesitamos convertir
nuestros valor de x en z, recordemos que la Media es 69 años y ahora damos el valor de
la Distribución Estándar el cual es de 14.3 años:

Para x = 55:
𝑥−𝑀
𝑧=
𝑆

55 − 69
𝑧= = −0.98
14.3

Siempre se aproxima a dos decimales. Este procedimiento se puede realizar para


cualquier valor de x que necesitemos, ahora veremos como se utilizan los valores de “z”
para calcular las áreas bajo la curva.

Ahora toda curva normal con valores de x se puede transformar a una curva normal
pero con valores de z, tal y como se muestra a continuación:

6 | e-Learning
Observaciones:
• Nótese que el eje horizontal ya no es x sino que z.
• El valor de la Media, ahora y siempre, será cero cuando esté expresado en z.
• En la imagen se ha sombreado una franja de distribución de probabilidad.

1.4 Área bajo la curva


Hemos visto que para calcular la probabilidad es necesario calcular el área bajo la
curva normal del conjunto de datos, el área se calcula con una “Tabla de Áreas Bajo
la Curva Normal” que también se llama “Tabla de Puntuaciones z” y por lo tanto es
necesario que convirtamos los valores de x que requiramos de nuestro
experimento, en valores de “z”.

1.4.1 Tabla de Puntuaciones z


Hemos adjuntado en la sección de Anexos de la presente unidad las “Tablas de
Puntuaciones Z” que son las que nos servirán para calcular el área bajo la curva
normal. Le sugiero que las analicen en detalle y sería muy bueno si las imprimen
para tenerlas a mano durante las explicaciones y desarrollo de ejemplos. Noten
que hay dos tablas, la de Puntuaciones z Negativas y la de Puntuaciones z
Positivas. A continuación se muestra el encabezado de la tabla de z negativas:

Observaciones:
• La flecha verde señala una muestra de área que va desde menos infinito
hasta el valor de z allí señalado.

7 | e-Learning
• La flecha azul señala la columna de valores de z, empieza con z=-3.5 y
continua hacia abajo con z=-3.4, luego z=-3.3 y así sigue con z tomando
valores cada vez más positivos hasta llegar al final con z=-0.0
• La flecha amarilla señala la fila de encabezados que representan la
segunda cifra decimal de z, por ejemplo la flecha morada está
señalando un valor de z=-3.56 ó z=-3.46 ó z=-3.36 etc.
• Y finalmente la flecha roja señala un área, en nuestra imagen nos está
señalando que para el valor de z=-3.42 el área bajo la curva es de 0.0003
lo cuál es de esperarse pues el valor de z está bien a la izquierda y
apenas si hay área bajo la curva.

Haremos un primer ejemplo repitiendo el cálculo de la probabilidad entre los


38 y los 69 años, que ya vimos anteriormente y que es P = 0.5, primero
convertimos x = 69 en z:

Para x = 69:
𝑥−𝑀
𝑧=
𝑆

69 − 69
𝑧= =0
14.3

Lo cual es el valor esperado pues ya vimos que la Media de toda distribución


normal vale cero en valores de z.

Ahora vamos a nuestra tabla de puntaciones z negativas y buscamos en la


primera columna el valor de 0, lo hemos señalado en la siguiente imagen:

Observaciones:
• La flecha azul señala el valor de cero, en realidad dice – 0.0 pero menos cero
no existe sino que es cero.

8 | e-Learning
• Como nuestro cero es exacto es decir no tiene segundo decimal el primer
área señalada es nuestra área (señalada con la flecha roja) y como vemos
da A = 0.5 que es el valor que encontramos anteriormente.

Siguiendo con nuestro ejemplo procedamos a encontrar la probabilidad de escoger al


azar a una persona que esté entre los 38 y los 55 años. Ya vimos que z =-0.98 para x= 55
así que procedemos a buscar ese valor de z en la primera columna y vemos que su valor
de área es igual a A = 0.1635

Entonces la probabilidad de escoger al azar a una persona entre los 38 y los 55 años es
de P(38 a 55) = 0.1635, se muestra esta probabilidad en el siguiente gráfico:

Ahora podemos calcular cualquier probabilidad que necesitemos de este conjunto de


datos. Por ejemplo, cual es la probabilidad de escoger a uno de los participantes del
programa de servicio social que esté ente los 75 y los 85 años.

9 | e-Learning
Primero volvemos z los valores de x:

Para x = 75
𝑥−𝑀
𝑧=
𝑆

75 − 69
𝑧= = 0.42
14.3
Para x = 85
85 − 69
𝑧= = 1.12
14.3

Como vemos ambos valores de z son positivos (esto es debido a que están más allá de
la Media, todo los valores de z desde menos infinito hasta la media son negativos y los
de valores desde la Media hasta el infinito positivo son positivos) por lo tanto los
buscamos en la columna de valores de z en la tabla de Puntuaciones z positivos para
luego ubicar los valores de área que les corresponde.

Entonces tenemos:
• Para x = 75 tenemos z = 0.42 y un A = 0.6628 (flecha azul)
• Para x = 85 tenemos z = 1.12 y un A = 0.8665 (flecha roja)

A continuación se muestra gráficamente la probabilidad solicitada y las áreas calculadas.

10 | e-Learning
Área para z = 0.42 es: A = 0.6628

Área para z = 1.12 es: A = 0.8665

Entonces podemos ver que para calcular el área azul de probabilidad es necesario
restarle al área roja el área verde lo cual deja el área azul:
11 | e-Learning
• 0.8665 – 0.6628 = 0.2037 entonces la probabilidad de escoger a alguien entre
los 75 y 85 años es de P (75 a 85) = 0.2037, como vemos es bastante pequeño
pues hay poca población dentro de esos márgenes.

Un último ejemplo, ¿cuál es la probabilidad de escoger a alguien mayor a los 80 años?

Para x = 80
𝑥−𝑀
𝑧=
𝑆

80 − 69
𝑧= = 0.77
14.3

Buscamos z = 0.77 en la tabla de Puntuaciones z positivas y nos da un área A = 0.7794,


se representa dicha área en el siguiente gráfico:

Ahora bien hay que tener cuidado y observar que la probabilidad solicitada es para las
personas mayores de 80 años, esa probabilidad está representada por el área blanca
del gráfico, sabiendo que toda el área bajo la curva tiene un valor de 1, entonces para
calcular el área blanca a 1 le restamos el área amarilla 0.7794 y nos dará por resultado
el área blanca y por ende el valor de la probabilidad.
• 1 – 0.7794 = 0.2206 entonces la probabilidad de escoger al azar a una persona
mayor a los 80 años es P(mayor a 80) = 0.2206

12 | e-Learning

También podría gustarte