Fase 3 - Distribución y probabilidad
Karen Alejandra Fandiño Vanegas
Juan Fernando Avendaño Ramos
Edinson Arley velasquez
Laren Dayana pino
Kenyi Johana Buitrago
Código 1007920190
Grupo 21
Nombre del tutor
Yessica Almeida braga
Universidad nacional abierta y a distancia
Programa agronomía
Escuela ciencias agrícolas pecuarias y del medio ambiente
Octubre 2021
Introducción
En el presente documento se desarrollarán una serie de actividades de distribución y probabilidad
con el fin de darle respuesta a cada uno de los ítems propuestos en la guía de actividades los
cuales nos permiten desarrollar nuestros conocimientos acerca de esta materia que es de suma
importancia en nuestro programa académico.
Objetivos
Objetivos específicos:
Reconocer los conceptos básicos de las probabilidades y las distribuciones más usadas y darle
respuesta a cada uno de los ejercicios en el programa R.
Objetivos generales:
Conceptos básicos.
Preguntas en el programa R.
Gráficos.
Modelos probabilísticos.
Distribución Poisson.
1. Revisar el OVI y los Contenidos y referentes bibliográficos de la Unidad 2, ubicados en el
Entorno de Aprendizaje y explicar en sus propias palabras los siguientes términos:
a. Espacio muestral, con qué letra se denota:
Por medio del espacio muestral se pueden agrupar resultados de los experimentos aleatorios, el
cual es de gran ayuda en cualquier experimento ya que nos facilita la obtención de los datos y
determinar la estructura.
Este se denota con la letra E
b. Punto muestral:
Los puntos muestrales son aquellos que se dan por medio del espacio muestral es decir de los
resultados de un experimento simple.
c. Evento muestral:
Este es formado por los elementos o resultados que se dan de la muestra hace parte de los
acontecimientos de la muestra dentro de los experimentos.
d. Variable aleatoria:
Las variables aleatorias nos permiten dar valores numéricos en los experimentos aleatorios.
E ¿Qué significa que el espacio muestral de una variable aleatoria continua es no contable?
El espacio muestral de una variable aleatoria continua no contable, es que siempre se va a dar de
la misma posibilidad de una serie de números fija dentro de un espacio muestral, ya que si fuese
continua seria consecutiva como enumerar la edad de miles de personas que esos datos si se
pueden contar.
F ¿Qué son variables aleatorias discretas proporcionales y que son variables aleatorias
discretas de conteo no acotado? De ejemplos de este tipo de variables.
Las variables discretas es importante distinguir al menos dos subtipos muy comunes en estudios
biológicos: variables aleatorias discretas proporcionales: las proporciones que provienen de
conteos que no pueden superar el número de elementos evaluados. El ejemplo de una variable
discreta expresada como proporción es el número de semillas germinadas en cajas de Petri con
25 semillas cada caja, estos resultados se expresan como proporciones porque existe un
denominador natural, siendo este la cantidad de semillas por caja
G Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina cada
uno.
La probabilidad es algo en término aleatorio. Poseemos el concepto clásico de estadística que se
refiere a un numero de resultados en una serie de eventos divididos en un numero de resultados
posibles, esta misma se emplea en casos como en un evento donde sea simple un espacio
muestral y este tenga la probabilidad de poderse repetir.
La probabilidad al concepto frecuencial, esta probabilidad se refiere a que tan posible un suceso
si de alguna forma un experimento u operación tiende a repetirse varias veces, ejemplificando
dicha definición como el cociente entre la cantidad de algunos casos que son favorables y
cantidad de casos o datos posibles cuando la cantidad de estos mismos tiende a tener infinidad de
resultados.
[Link] el caso de la probabilidad frecuencial, explique el experimento de germinación de una
semilla, cuál es el experimento aleatorio, cuál es el evento y cuantos puntos muéstrales
tiene.
En un experimento de germinación de semillas, se dice que el experimento aleatorio es la
posibilidad de que las semillas germinen o no, el evento es “encontrar la semilla germinada
“representando con la letra A; entonces:
n A 400
P( A)=P(observar semilla germinada)= = =0,4
N 1000
Donde las 400 semillas que germinaron son los puntos muéstrales.
I ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de probabilidad?
Una diferencia entre estos dos conceptos no es correcta afirmarla, debido a que el concepto de
probabilidad, es el número de veces que puede suceder un evento y como resultado de dicho
análisis se obtiene la probabilidad frecuencial o frecuencia relativa y esta nos informa acerca de
la proporción o el peso que tiene algún valor u observación en la muestra y el rango de este valor
siempre estará entre 0 y 1
J ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos eventos
mutuamente excluyentes? ¿Si son excluyentes, dado un evento A y uno B, a que es igual la
P (A U B)?
Los eventos mutuamente excluyentes son los resultados de un evento que no es posible que
ocurran simultáneamente. La intersección de dos eventos mutuamente excluyentes se denota
como un conjunto vacío. A una serie de eventualidad A y una B la operación P(AUB) es P(A) +
P(B) -P (A∩B).
K En el caso de distribuciones de variables aleatorias, si una variable es continua y
simétrica, ¿qué modelo se usa?
La distribución Poisson facilita el cálculo de probabilidades, si una variable es continua y
simétrica.
L Para una variable de conteo no acotado, ¿qué modelo se utiliza?
Se utiliza el modelo de regresión y es importante dejar expresado que si bien el valor puede ser
continuo en el rango 0-1.
M. Para variables de proporciones ¿qué modelo se utiliza?
Se utiliza el modelo de regresión beta ya que es un modelo matemático que busca la relación de
las variables dependiente e independiente, también busca su impacto sobre la variable
dependiente si hay algún cambio en la variable independiente.
N. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función de
densidad?
La Función de Probabilidad es la probabilidad de que la variable aleatoria tome un valor
particular:
Las variables que tienen función de densidad son variable aleatoria discreta, las variables
Aleatorias continuas que son generalizadas de la función de probabilidad.
O. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar funciones
de distribución de variables aleatorias?
La varianza y el valor esperado son los parámetros más usados en estadística, para estudiar y
utilizar funciones de distribución de variables aleatorias. La varianza forma la idea de
incertidumbre sobre el fenómeno y menor precisión de las conclusiones que podemos elaborar
desde los datos que los caracterizan, el valor esperado formaliza la idea de valor medio de un
fenómeno aleatorio.
P. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se denota?
En estadística la esperanza matemática (también llamada esperanza, valor esperado, media
poblacional o media) de una variable aleatoria X, es el número {E} [X {E} [X]} o {E}} [X]}
{{E}} [X]} que formaliza la idea de valor medio de un fenómeno aleatorio.
Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de
cada posible suceso aleatorio multiplicado por el valor de dicho suceso.
2. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de Mónica
Balzarini y responda las siguientes preguntas:
a. Qué tipo de histograma se debe seleccionar en un modelo probabilístico para una
variable aleatoria continua cuando se tienen datos de esa variable.
El histograma que se debe seleccionar para un modelo probabilístico para una variable aleatoria
continua cuando se tienen datos de la variable es un histograma de frecuencias relativas y
observar la forma del mismo. (varios, 2014)
b. Qué es la estandarización, cuál es su fórmula.
Según se indica (varios, 2014) Es una transformación que nos permite llevar cualquier
distribución normal a la distribución normal estándar. tiene la siguiente forma:
c. Qué tipo de conteos se trabajan con la distribución Binomial.
El tipo de conteos que se trabajan con la distribución binominal son los conteos acotados.
(varios, 2014)
d. En la distribución binomial qué es n y qué es P.
En la distribución binominal n es el número de veces que se repite el experimento y P es
probabilidad (varios, 2014)
e. A qué es igual la esperanza y la varianza en la distribución binomial.
La esperanza o también llamada valor esperado es igual a: 𝐸(𝑥) = 𝑛 ∗ 𝑝
La varianza es igual a: 𝑉(𝑥) = 𝑛 ∗ 𝑝 ∗ (1− 𝑝)
f. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución
Binomial.
En mi área de estudio la cual es agronomía podemos utilizar la distribución binomial para
identificar el tipo de insectos que atacan a los cultivos, Identificación de los tipos de suelos,
cantidad de insecticidas apropiado para el cultivo.
g. Qué tipos de conteos se trabajan con la distribución de Poisson.
En la distribución de poisson se trabajan conteos donde el numero de veces de los eventos
ocurren en la unidad de tiempo y espacio determinado. Como, por ejemplo: la hora, metro
cuadro, metros cúbicos etc.
h. Cómo se denota el único parámetro de la distribución de Poisson.
Este se denota con el parámetro lambda λ el cual es igual a media y la varianza el cual es útil
para describir el numero de veces que ocurre un evento en un espacio finito de observación.
i. ¿A qué es igual la media y la varianza en la distribución de Poisson?
La varianza de Poisson aumenta a medida que aumentan los conteos y esta es función de la
media.
j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución de
Poisson.
En agronomía se podría utilizar para contar la cantidad de productos que salen de los sistemas de
producción por ejemplo de un cultivo de naranjas, calcular la cantidad de frutos infectados y en
mal estado entre muchos mas ya que este es de gran ayuda para poder calcular e identificar las
falencias o buenos resultados con más facilidad.
3. Abra “Script Fase 3 - [Link]”, ejecútelo y responda las siguientes preguntas:
a. Explique en sus propias palabras el experimento aleatorio del dado. Este ejercicio nos
ayudará a entender los conceptos de probabilidad y distribución.
Consiste en determinar las probabilidades de obtener diferentes resultados al lanzar dos dados.
Al lanzar los dados existen 36 posibilidades de obtener resultados, los cuales pueden caer 1-1, 1-
2, 2-2, 2- y así sucesivamente hasta llegar a los 36 diferentes resultados, los cuales se denominan
espacio muestral. por otra parte, alanzar los dados existen otras posibilidades las cuales se
obtienen dos números impares 3-5, y dos números pares 2-4, también tenemos la posibilidad de
sacar dos números iguales 6-6, la cual es más remota, a estos resultados los podemos denominar
subconjuntos o eventos.
Para los números iguales obtenemos un total de seis combinaciones diferentes 1-1, 2-2, 3-3, 4-4,
5-5, 6-6. Los seis resultados lo dividimos en el total de los resultados (36) y así obtenemos la
probabilidad (6/36=0,1), seguido al multiplicarlo por 100 obtenemos un 16,6% de probabilidades
de obtener números iguales al lanzar dados.
b. Adjunte en el informe los tres gráficos generados por el script (Frecuencias Absolutas,
frecuencias relativas y frecuencias relativas acumuladas). No debe haber más de un gráfico
por página.
Podemos identificar que el evento que mas se repite es el de resultado 6. Por consiguiente
tenemos mayor probabilidad de obtener un 6 en nuestro lanzamiento.
PERIODO 954 - Gráfico de barras SUMA DE CARAS
6
5
4
Frecuencias absolutas
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12
El grafico de frecuencias relativas nos evidencia que el resultado que más podemos obtener de la
suma de caras seria de 7.
PERIODO 954 - FRECUENCIAS RELATIVAS SUMA DE CARAS
0.20
0.15
Frecuencias relativas
0.10
0.05
0.00
2 3 4 5 6 7 8 9 10 11 12
El grafico nos permite identificar el peso i-enésimo acumulado de todas las muestras de nuestro
evento.
PERIODO 954 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS
1.0
0.8
0.6
Frecuenciasrelativas
0.4
0.2
0.0
2 3 4 5 6 7 8 9 10 11 12
Identificando que las probabilidades entre cada uno de los resultados tienen poca diferencia de
rango.
c. Haga una breve descripción y explicación de cada uno de los gráficos adjuntados.
Recuerde que no debe poner pantallazos en su informe, para presentar los gráficos debe
hacer clic sobre el gráfico con el botón derecho del mouse y seleccionar “Copiar como
metafile” para posteriormente pegarlo (“Control+V”) en su informe.
1
La probabilidad de cada evento es de
36
Utilizando la fórmula de distribución binomial. Esta especifica el número de veces (x) que puede
ocurrir un evento en un número independiente de tiradas n y donde p es la probabilidad de la
ocurrencia del evento en una simple tirada
4. Abra en el programa R “Script Fase 3 – [Link]” y ejecútelo. Este script dará
respuesta a los ejercicios del libro “Estadística y Biometría de Mónica Balzarini” en el
Capítulo 3 – Modelos probabilísticos; describa los ejercicios y responda las siguientes
preguntas:
a. Distribución normal - Ejercicio de las vacas del tambo (página 91).
i. Presente y describa el gráfico "Producción de leche - Función de Distribución N (misma
varianza, distinta media)". Este gráfico muestra dos distribuciones dentro de la misma
gráfica -una azul y otra roja-. Para obtenerlo, cuando aparezca la gráfica de distribución
de color azul, NO LA CIERRE, continúe ejecutando el script (para volver al script, ubique
el cursor en el marco azul, donde aparece el nombre del script, para que no pierda la
secuencia de ejecución).
ii. Presente y describa el gráfico "Producción de leche - Función de Distribución N (misma
media, distinta varianza". Al igual que el anterior, muestra dos distribuciones en la misma
gráfica, cada una con distinta varianza, cuando le aparezca el primer gráfico (color azul)
no lo cierre y continúe ejecutando el script hasta que le aparezca la segunda línea de
distribución (color rojo).
b. Probabilidad en distribución normal - Ejercicio del híbrido de maíz (página 93).
i. Presente y describa el gráfico “Rendimiento de maíz - Función de Distribución N
([Link])”
ii. Indique los valores de media (µ) y sigma (σ).
iii. Indique la probabilidad de que el rendimiento sea igual o menor que 55 qq/Ha.
iv. Indique la probabilidad de que el rendimiento sea mayor que 55 qq/Ha.
v. Indique la probabilidad de que el rendimiento se encuentre entre 50 y 65 qq/Ha.
vi. Presente y describa el gráfico “Rendimiento de maíz Distribución Normal con área bajo
la curva”
c. Distribución binomial - Ejercicio de la semilla de Panicum sp. (página 102).
i. Indique la probabilidad de que germinen 8 de las 10 semillas.
# Supóngase que se toman 10 semillas de Panicum sp y se registra el evento "Germinó"o "No
germinó", después de 5 días de sembradas:
n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el número de
semillas evaluadas
p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento
# Queremos saber la probabilidad que germinen 8 de las 10 semillas:
k= 8
# Probabilidad de que germinen 8 de las 10 semillas:
dbinom(k,n,p)
Respuesta:
> dbinom(k,n,p)
[1] 0.0003862381
ii. Indique la probabilidad de que germinen al menos 4 de las 10 semillas.
# En este caso, se interpreta como la probabilidad de que germinen 4 o más semillas
# Es equivalente a la probabilidad que germinen 4 semillas, más la probabilidad que germinen 5,
más la prob. que germinen 6; y así sucesivamente hasta 10.
# Otra forma de calcularlo es a la inversa, calculando la probabilidad que germinen menos de 4 y
restándole a la probabilidad total:
k1=3 # Hay que calcular la probabilidad de un valor que sea una unidad menor que el que
queremos hallar
pbinom(k1,n,p) # probabilidad de que germinen 3 semillas o menos
Respuesta:
[1] 0.7758751
iii. Indique la probabilidad de que germinen 4 o más semillas.
1-pbinom(k1,n,p)
Respuesta:
[1] 0.2241249
iv. Indique la probabilidad de que germinen a lo sumo 6 semillas.
# A lo sumo se interpreta que germinen máximo 6 semillas:
k2=6
pbinom(k2,n,p) # probabilidad de que germinen máximo 6 semillas
Respuesta:
[1] 0.9964943
v. Indique la esperanza (E) de esta variable aleatoria.
# La esperanza de esta variable aleatoria:
E=n*p
Respuesta:
[1] 2.5
vi. Indique la varianza (V) de esta variable aleatoria.
# La varianza de esta variable aleatoria:
V=n*p*(1-p)
Respuesta:
[1] 1.875
vii. Presente y describa el gráfico “Distribución Binomial - Germinación de
semillas\n(n=10,p=0.25)”
Respuesta:
11. Abra en el programa R
“Script Fase 3 –
[Link]” y ejecútelo de
acuerdo con
las indicaciones dadas
previamente. Este script dará
respuesta a los ejercicios del
libro
“Estadística y Biometría de
Mónica Balzarini” en el
Capítulo 3 – Modelos
probabilísticos; describa los
ejercicios y responda las
siguientes preguntas:
c. Distribución binomial -
Ejercicio de la semilla de
Panicum sp.(página 102).
i. Indique la probabilidad de que
germinen 7 de las 10 semillas.
Supóngase que se toman 10
semillas de Panicum sp y se
registra el evento "Germinó" o
"No germinó", después de 5
días desde su implantación:
k= 7 # Queremos saber la
probabilidad que germinen 7 de
las 10 semillas
n= 10 # Número total de
ensayos realizados, en este caso
son 10, que fueron el número
de semillas evaluadas
p= 0.25 # La probabilidad de
germinación de las semillas fue
del 25 por ciento
dbinom(k, n, p) #
PROBABILIDAD DE UN
VALOR IGUAL P(X=7), "que
germinen
siete semillas"
11. Abra en el programa R
“Script Fase 3 –
[Link]” y ejecútelo de
acuerdo con
las indicaciones dadas
previamente. Este script dará
respuesta a los ejercicios del
libro
“Estadística y Biometría de
Mónica Balzarini” en el
Capítulo 3 – Modelos
probabilísticos; describa los
ejercicios y responda las
siguientes preguntas:
c. Distribución binomial -
Ejercicio de la semilla de
Panicum sp.(página 102).
i. Indique la probabilidad de que
germinen 7 de las 10 semillas.
Supóngase que se toman 10
semillas de Panicum sp y se
registra el evento "Germinó" o
"No germinó", después de 5
días desde su implantación:
k= 7 # Queremos saber la
probabilidad que germinen 7 de
las 10 semillas
n= 10 # Número total de
ensayos realizados, en este caso
son 10, que fueron el número
de semillas evaluadas
p= 0.25 # La probabilidad de
germinación de las semillas fue
del 25 por ciento
dbinom(k, n, p) #
PROBABILIDAD DE UN
VALOR IGUAL P(X=7), "que
germinen
siete semillas"
11. Abra en el programa R
“Script Fase 3 –
[Link]” y ejecútelo de
acuerdo con
las indicaciones dadas
previamente. Este script dará
respuesta a los ejercicios del
libro
“Estadística y Biometría de
Mónica Balzarini” en el
Capítulo 3 – Modelos
probabilísticos; describa los
ejercicios y responda las
siguientes preguntas:
c. Distribución binomial -
Ejercicio de la semilla de
Panicum sp.(página 102).
i. Indique la probabilidad de que
germinen 7 de las 10 semillas.
Supóngase que se toman 10
semillas de Panicum sp y se
registra el evento "Germinó" o
"No germinó", después de 5
días desde su implantación:
k= 7 # Queremos saber la
probabilidad que germinen 7 de
las 10 semillas
n= 10 # Número total de
ensayos realizados, en este caso
son 10, que fueron el número
de semillas evaluadas
p= 0.25 # La probabilidad de
germinación de las semillas fue
del 25 por ciento
dbinom(k, n, p) #
PROBABILIDAD DE UN
VALOR IGUAL P(X=7), "que
germinen
siete semilla
x <- 0:n
> prob <- dbinom(x,n,p)
> barplot(prob,col = "red",[Link]=x,
+ xlab="Evento (germinación de x semillas)",ylab="Probabilidad del
evento",main="PERIODO 954 - Distribución Binomial - Germinación de
semillas\n(n=10,p=0.25)")
‘En esta grafica se puede observar la probabilidad que germine mejor una semilla es
decir que tenga éxito es la cantidad de 2 semillas, que entre más semillas hay menos
probabilidad de éxito que germine las semillas y que entre menos semillas la
probabilidad es poca a nula.
d. Distribución Poisson - Ejercicio de las picaduras de gorgojo (página 105).
i. Indique la probabilidad de que en 100 semillas dos tengan 1 picadura.
Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2 (es decir, que
cada 100 semillas 20 tienen picaduras) PROBABILIDAD DE UN VALOR EXACTO
X1= 1 valor de conteo que se quiere calcular la probabilidad
Lamda=0.2 en la distribución de poisson lamda equivale a la media o la varianza, son el mismo
valor Dpois (x1, lamda) la probabilidad de que en 100 semillas una tenga 1 picadura es de
0.1637 o de 16.37 %.
ii. Indique la probabilidad de que en 100 semillas dos o más tengan picaduras.
En el caso de dos o más picaduras toca a uno quitarle las probabilidades de cero más la de uno
x0=0 el valor de conteo que se quiere calcular la probabilidad en este caso que ninguna semilla
tenga picaduras.
iii. Indique la probabilidad de que en 100 semillas una tenga picaduras.
x2=1 lamda=0.2 La probabilidad de que ninguna semilla tenga picaduras es de 0.8187 0 del
81.87 % y la probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 11.8
%.
Si la probabilidad de que una semilla tomada al azar no tenga picaduras es 0.8187308 (81,87),
deberíamos esperar que, en un grupo de 100; aproximadamente 82 semillas no estén picadas, y si
la probabilidad de que tengan solo una picadura es de 0.1637462 (16,37), entonces solo 16
semillas cumplirán esta condición y finalmente 0.0175231 (1,7), aproximadamente 2 de cada 100
semillas tendrán 2 o más picaduras de gorgojos.
Conclusión
El trabajo realizado es para a colocar en práctica los conceptos de probabilidad y la
aplicación de la distribución normal, distribución binomial y la distribución de Poisson,
teniendo la aplicación del programa R.
La probabilidad es la menor o mayor posibilidad de que ocurra un evento y se obtiene
otra necesidad para determinar una certeza o una duda de que ocurra un suceso.
La probabilidad de ocurrencia de un evento es proveniente de la observación de una
característica en nuestro caso en el área agropecuaria.
Para concluir este trabajo fue de gran aprendizaje ya que realizamos diferentes métodos y
la utilización del programa R el cual es de suma importancia ya que en este podemos
realizar cálculos de forma rápida que nos permite obtener los resultados con más
facilidad.
Bibliografía
García, P. A. (2014). La interpretación de los datos: Una introducción a la estadística aplicada.
UNED - Universidad Nacional de Educación a Distancia. Biblioteca virtual UNAD
[Link]
Balzarini Mónica; Di Rienzo Julio; Tablada Margot; Gonzalez, Laura; Bruno Cecilia; Córdoba
Mariano; Robledo Walter; Casanoves Fernando. 2011. Editorial Brujas 1º Edición Primera
Impresión Impreso en Argentina: “Introducción a la Bioestadística. Aplicaciones con InfoStat en
Agronomía” de Balzarini et al.