“Probabilidad y estadística”
Actividad 1, Segundo Parcial
Jose Francisco Miramontes Ornelas
18310398
4°A
INDICE
Distribuciones de Probabilidad.
Variables aleatorias discretas y continuas. ..................................................................................... 1
Variables aleatorias discretas ..................................................................................................... 1
Variables aleatorias continuas .................................................................................................... 2
Función de probabilidad y su distribución acumulada. ................................................................... 4
Funciones de densidad de probabilidad y su distribución acumulada. ............................................ 5
Distribuciones de probabilidad de variables continuas ............................................................... 5
Estadística.
Medias de tendencias centrales para datos no agrupados (media aritmética, mediana y moda). ... 7
Media ........................................................................................................................................ 7
Mediana .................................................................................................................................... 8
Moda ......................................................................................................................................... 8
Medias de tendencia central para datos agrupados (media aritmética, mediana y moda). ........... 10
Media ...................................................................................................................................... 10
Mediana (Me) .......................................................................................................................... 10
Moda (Mo) ............................................................................................................................... 11
Medidas de dispersión para datos no agrupados (rango, varianza y desviación estándar). ........... 13
Varianza ................................................................................................................................... 13
Desviación estándar ................................................................................................................. 13
Rango ...................................................................................................................................... 13
Medidas de dispersión para datos agrupados (rango, varianza y desviación estándar). ................ 14
EL RECORRIDO, AMPLITUD O RANGO (R) .................................................................................. 14
VARIANZA ................................................................................................................................ 15
DESVIACIÓN ESTÁNDAR ........................................................................................................... 16
Bibliografías ................................................................................................................................. 18
Distribuciones de probabilidad
Variables aleatorias discretas y continuas.
Una variable aleatoria X es una función definida sobre el espacio muestral Ω
(conjunto de los resultados de un experimento aleatorio) que toma valores en el
cuerpo de los números reales IR, es decir
X: Ω → IR
Una variable aleatoria puede ser discreta o continua según sea el rango de esta
aplicación.
• Una variable aleatoria es discreta si toma un número de valores finito o
infinito numerable. Estas variables corresponden a experimentos en los que
se cuenta el número de veces que ha ocurrido un suceso.
• Una variable aleatoria es continua cuando puede tomar cualquier valor de
un intervalo real de la forma (a, b),(a,∞),(−∞, b),(−∞, +∞) o uniones de ellos.
Por ejemplo, el peso de una persona, el tiempo de duración de un suceso,
etc.
Variables aleatorias discretas
Para la descripción de una variable aleatoria discreta, se especifican los posibles
valores de la variable con sus respectivas probabilidades. Sea X una variable
aleatoria que toma valores x1, x2, . . . , xn, . . .. Entenderemos por P(X = xi) como
la probabilidad del suceso
X^−1 (xi) = {w ∈ Ω : X(w) = xi} = A ∈ Q.
Por ejemplo, en el experimento consistente en lanzar dos monedas, el espacio
muestral es Ω = {(c, c),(c, f),(f, c),(f, f)}, donde c representa cara y f representa
cruz. Sobre este espacio se puede definir la función X : Ω → IR dada por X(w) =
”número de caras que aparecen”. Esta ´ es una variable aleatoria discreta, ya que
toma los valores
X(f, f) = 0; X(c, f) = X(f, c) = 1; X(c, c) = 2
y las probabilidades con que toma estos valores serán
P(X = 0) = ¼ ; P(X = 1) = 2/4 ; P(X = 2) = ¼
1
La función de distribución de una variable aleatoria discreta X se define por
Ejemplo 3.8
Seis lotes de componentes están listos para ser enviados por un proveedor. El
número de componentes defectuosos en cada lote es como sigue:
Uno de estos lotes tiene que ser seleccionado al azar para ser enviado a un
cliente particular. Sea X el número de defectuosos en el lote seleccionado. Los
tres posibles valores de X son 0, 1 y 2. De los seis eventos simples igualmente
probables, tres dan por resultado X = 0, uno X = 1 y los otros dos X = 2. Entonces
Es decir, una probabilidad de 0.5 se asigna al valor 0 de X, una probabilidad de
0.167 se asigna al valor 1 de X y la probabilidad restante 0.333 se asocia con el
valor 2 de X. Los valores de X junto con sus probabilidades especifican la función
de masa de probabilidad. Si este experimento se repitiera una y otra vez, a la larga
X = 0 ocurriría la mitad del tiempo, X = 1 un sexto del tiempo y X = 2 un tercio del
tiempo.
Variables aleatorias continuas
En las variables continuas, hay que observar que la probabilidad de que la variable
tome un valor particular se considera igual a cero. Se supone que no es posible
conocer el valor exacto de una variable continua, ya que medir su valor consiste
en clasificarlo dentro de un intervalo. Las variables aleatorias continuas se
describen por medio de una función real de variable real, a la que se denomina
función de densidad.
Llamaremos función de densidad de una variable aleatoria X a una función real
f(x) no negativa (f(x) ≥ 0) tal que
2
y de forma que es posible calcular la probabilidad de que X tome valores en un
cierto intervalo |a, b|, por integración
Ejemplo, si vamos a una agencia del banco y registramos los datos de atención a
los clientes, podemos definir la variable aleatoria D:
• D = tiempo de atención a los clientes del banco (en segundos).
Un cliente puede ser atendido en 24,123 s; otro cliente en 72,32142 s; otro en
51,123123 s. Si seguimos tomando más clientes, tendríamos más valores. Se
conoce además que el tiempo mínimo de atención en ventanilla es de 1 s y el
tiempo máximo es de 240 s.
D = tiempo de atención de ventanilla (en s)
RD = 1 <_ d <_ 240
Y así, tendríamos un número incontable de valores para el rango de esta variable.
El rango de esta variable puede ser cualquier valor dentro del intervalo que va
desde 1 s hasta 240 s. Por ello, se trata de una variable aleatoria continua.
3
Función de probabilidad y su distribución
acumulada.
Para algún valor fijo x, a menudo se desea calcular la probabilidad de que el valor
observado de X será cuando mucho x. Por ejemplo, la función masa de
probabilidad en el ejemplo 3.8 fue
De lo contrario
La probabilidad de que X sea cuando mucho de 1 es entonces
En este ejemplo, X <_ 1.5 si y sólo si X <_ 1, por lo tanto
Así mismo,
y de hecho con cualquier x que satisfaga 0 <_ x < 1, P(X <_ x) = 0.5. El valor X
más grande posible es 2, por lo tanto
Y así sucesivamente
4
Funciones de densidad de probabilidad y su
distribución acumulada.
Una variable aleatoria (va) discreta es una cuyos valores posibles o constituyen un
conjunto finito o bien pueden ser puestos en lista en una secuencia infinita (una
lista en la cual existe un primer elemento, un segundo elemento, etc.). Una
variable aleatoria cuyo conjunto de valores posibles es un intervalo completo de
números no es discreta.
Ejemplo1:
En el estudio de la ecología de un lago, se mide la profundidad en lugares
seleccionados, entonces X = la profundidad en ese lugar es una variable aleatoria
continua. En este caso A es la profundidad mínima en la región muestreada y B es
la profundidad máxima
Ejemplo2:
Sea X la cantidad de tiempo que un cliente seleccionado al azar pasa esperando
que le corten el pelo antes de que comience su corte de pelo. El primer
pensamiento podría ser que X es una variable aleatoria continua, puesto que se
requiere medirla para determinar su valor. Sin embargo, existen clientes
suficientemente afortunados que no tienen que esperar antes de sentarse en el
sillón del peluquero. Así que el caso debe ser P(X = 0) = 0. Condicional en cuanto
a los sillones vacíos, aun cuando, el tiempo de espera será continúo puesto que X
podría asumir entonces cualquier valor entre un tiempo mínimo posible A y un
tiempo máximo posible B. Esta variable aleatoria no es ni puramente discreta ni
puramente continua, sino que es una mezcla de los dos tipos.
Distribuciones de probabilidad de variables continuas
La variable X de interés es la profundidad de un lago en un punto sobre la
superficie seleccionado al azar. Sea M = la profundidad máxima (en metros), así
que cualquier número en el intervalo [0, M] es un valor posible de X. Si se
“discretiza” X midiendo la profundidad al metro más cercano, entonces los valores
posibles son enteros no negativos menores que o iguales a M.
En la figura 4.1b) se ilustra un posible histograma; tiene una apariencia mucho
más regular que el histograma de la figura 4.1a). Si se continúa de esta manera
midiendo la profundidad más y más finamente, la secuencia resultante de
histogramas se aproxima a una curva más regular, tal como la ilustrada en la
figura 4.1c). Como en cada histograma el área total de todos los rectángulos es
igual a 1, el área total bajo la curva regular también es 1. La probabilidad de que la
profundidad en un punto seleccionado al azar se encuentre entre a y b es
simplemente el área bajo la curva regular entre a y b. Es de manera exacta una
5
curva regular del tipo ilustrado en la figura 4.1c) la que especifica una distribución
de probabilidad continua.
Figura 4.1 a) Histograma de probabilidad de profundidad medida al metro más
cercano; b) histograma de probabilidad de profundidad medida al centímetro más
cercano; c) un límite de una secuencia de histogramas discretos.
Definición:
Sea X una variable aleatoria continua. Entonces, una distribución de probabilidad
o función de densidad de probabilidad (fdp) de X es una función f(x) tal que para
dos números cualesquiera a y b con a <_ b,
Es decir, la probabilidad de que X asuma un valor en el intervalo [a, b] es el área
sobre este intervalo y bajo la gráfica de la función de densidad.
6
Estadística
Medias de tendencias centrales para datos no
agrupados (media aritmética, mediana y moda).
Son medidas que nos permiten conocer las características de un conjunto de
datos porque miden de diferentes formas, hacia qué valor se acerca el centro de
ese conjunto de datos.
Existen tres medidas comunes para identificar el centro de un conjunto de datos:
la media, mediana y moda.
Media
También conocida como media aritmética, promedio aritmético o simplemente
promedio. Para calcularla no es indispensable acomodar los datos en orden.
Los datos recabados como cero no modifican la suma, pero sí cuentan para
determinar el número entre el que se divide, por lo que sí modifican el
promedio.
Formulas:
Ejemplo:
Se han tomado como muestra las medidas de seis cables usados en un arnés
para lavadora, las cuales son; 15.2 cm, 15.0 cm, 15.1 cm, 15.2 cm, 15.1cm y
15.0cm, determinar su media aritmética:
X = 15.2 + 15.0 + 15.1 + 15.2 + 15.1 + 15.0 = 15.1 cm
6
7
Mediana
Es el valor que al organizar los datos en orden ascendente o descenderte a la
mitad o centro de los mismos.
Formula:
X = [(n/2) + 1/2]
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en
un arnés de lavadora; se toman como muestra ocho circuitos y sus mediciones
son: 11.3, 11.2, 11.1, 11.2, 11.2, 11.4, 11.5, 11.4 cm.
Ordenando los datos de mayor a menor valor:
11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11.1 cm.
X = [(8/2) + 1/2] = [(4) + 0.5] = 4.5
Por lo que la mediana está ubicada entre el dato 4 y 5
11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11.1 cm.
La mediana se determina con el promedio de los datos subrayados, entonces;
Xmediana = 11.3 +11.2 = 11.25 cm.
2
Moda
La moda se define como aquel valor o valores que más se repiten o que tienen
mayor frecuencia entre los datos que se han obtenido en una muestra, la
muestra de una población nos genera la distribución de los datos una vez que
estos se han graficado y en esta gráfica es posible observar la moda o modas
de la misma, es por esto que una distribución de datos puede ser amodal
(carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas)
o polimodal (tiene más de dos modas).
Ejemplos:
1. Determine la moda de los datos que se muestran a continuación, se
refieren a la estatura de un grupo de jóvenes; 1.60m, 1.65, 1.70, 1.71,
1.70, 1.70, 1.70, 1.71, 1.70, 1.93, 1.87, 1.85.
8
Estatura Frecuencia
1.60 1
1.65 1
1.70 5
1.71 2
1.85 1
1.87 1
1.93 1
La tabla muestra la distribución de frecuencias de los datos o el número
de veces que estos se repiten, la mayor frecuencia que es 5
corresponde a una estatura de 1.70m, por lo que esta sería la moda.
Xmod = 1.70 cm.
2. Determine la moda de los siguientes datos que se refieren a la edad de
alumnos de primer semestre del tecnológico de Chihuahua, 18 años, 17,
19, 21, 19, 18, 22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18,
19, 18,19, 22, 35.
Edad Frecuencia
17 2
18 7
19 8
20 2
21 2
22 3
35 1
En este caso se observa que las edades que más frecuencia tienen son
las de 18 y 19 años, por lo que se concluye que existen dos modas:
Xmod1= 18 años Xmod2= 19 años
9
Medias de tendencia central para datos agrupados
(media aritmética, mediana y moda).
Cuando se trabaja con datos que han sido agrupados en una distribución de
frecuencias, no se sabe con certeza los valores individuales de cada dato. Por lo
que se utilizan métodos alternos para aproximar los valores de las medidas
descriptivas.
Media
La media aritmética es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la
media es:
Ejemplo:
En un test realizado a un grupo de 42 personas se han obtenido las
puntuaciones que muestra la tabla. Calcula la puntuación media.
Xi Fi Xi * Fi
(10,20) 15 1 15
(20,30) 25 8 200
(30,40) 35 10 350
(40,50) 45 9 405
(50,60) 55 8 440
(60,70) 65 4 260
(70,80) 75 2 150
42 1,820
X = 1,820 = 43.33
42
Mediana (Me)
Es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor.
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega
hasta la mitad de la suma de las frecuencias absolutas.
10
Formula:
Li = es el límite inferior de la clase donde se encuentra la mediana.
N/2 = es la semisuma de las frecuencias absolutas.
Fi-1 = es la frecuencia acumulada anterior a la clase mediana.
ai = es la amplitud de la clase.
Ejemplo:
Calcular la mediana de una distribución estadística que viene dada por la
siguiente tabla:
fi Fi
(60,63) 5 5
(63,66) 18 23
(66,69) 42 65
(69,72) 27 92
(72,75) 8 100
100
100/2 = 50
Clase modal: (66,69)
Me = 66 + 50 – 23 * 3 = 67.92
42
Moda (Mo)
La moda es el valor que tiene mayor frecuencia absoluta. Se puede hallar la
moda para variables cualitativas y cuantitativas.
Formula:
Li = es el límite inferior de la clase modal.
fi = es la frecuencia absoluta de la clase modal.
fi-1 = es la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi+1 = es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai = es la amplitud de la clase.
11
También se utiliza otra fórmula de la moda que da un valor aproximado de
ésta:
Ejemplo:
Calcular la moda de una distribución estadística que viene dada por la
siguiente tabla:
Fi
(60,63) 5
(63,66) 18
(66,69) 42
(69,72) 27
(72,75) 8
100
Mo = 66 + (42-18) * 3 = 67.846
(42 – 18) + (42-27)
Mo = 66 + 27 * 3 = 67.8
18 + 27
12
Medidas de dispersión para datos no agrupados
(rango, varianza y desviación estándar).
Las medidas de dispersión muestran la variabilidad de una distribución indicando
por medio de un número si las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuanto sea ese valor, mayor será la variabilidad. Cuanto
menor sea, más homogénea será a la media.
Una manera para construir una medida de dispersión seria promediar las
desviaciones de la media.
Calculó usando la frecuencia absoluta, recolección simple o no organizado (datos
no agrupados) es el listado de los datos presentados en su forma primaria, es
decir tal como fueron obtenidos durante el proceso de observación o medición en
la muestra o población.
Varianza
Es el resultado de la división de la sumatoria de las distintas existentes entre cada
dato y su media aritmética elevadas al cuadrado, y el numero total de datos.
Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales y
o2 para datos poblacionales
Desviación estándar
Es una medida de dispersión usada en estadística que nos dice cuanto tienden
alejarse los valores puntuales del promedio en una distribución, de echo
específicamente la desviación estándar es “el promedio de la distancia de cada
punto respecto del promedio” se calcula de manera sencilla, si se conoce la
varianza.
Rango
Se mide como la diferencia entre el valor mayor y el valor menor, este rango se
obtiene del resultado de la resta del valor matoy y menor.
Ejemplo:
12,9,3,6,15,17,26,2,8.
R = X max – X min = 26-2 = 2
13
Medidas de dispersión para datos agrupados
(rango, varianza y desviación estándar).
La dispersión o variación es una característica importante de un conjunto de datos
porque intenta dar una idea de cuán esparcidos se encuentran éstos. Existen
diversas medidas de dispersión, algunas de ellas son: El Rango, la Desviación
media, la Varianza y la Desviación estándar o Desviación típica,
La utilización de una medida de posición escogida para representar a los datos no
indica otras características que el conjunto de observaciones que posee. No todas
las observaciones son iguales a la medida de posición tomada o seleccionada, en
general los datos difieren unos de otros por lo tanto se hace necesario encontrar
ciertos índices o medidas que indiquen la variabilidad o dispersión del conjunto de
observaciones que se estudian.
EL RECORRIDO, AMPLITUD O RANGO (R)
Una forma natural de apreciar la variabilidad es considerar los valores extremos
del grupo de datos. Esto da origen al recorrido o amplitud, que se define como la
diferencia entre el valor mayor y el valor menor del conjunto de datos. Su cálculo
es simple; por ejemplo, lo calcularemos para los siguientes datos: 3, 10, 2, 8, 7.
recorrido=10-2=8. También puede indicarse dando directamente los valores
extremos, o sea, para el ejemplo considerado: Recorrido de 2 a 10
No obstante, lo simple de su cálculo y lo fácil que resulta percibir su significado, el
recorrido no es muy usado debido a ciertas limitaciones que presenta. La más
importante, como puede apreciarse en su definición es la de que no toma en
cuenta todas las observaciones del grupo o muestra, sino únicamente el mayor y
el menor. Esta característica hace que dependa sensiblemente del número de
datos y que aumente al crecer este número ya que es probable que, entre las
nuevas observaciones agregadas aparezca una más pequeña y/o una de mayor
valor que las existentes y eso producirá un incremento en el valor del recorrido. En
la práctica el recorrido se utiliza cuando se desea una medida simple de la
variabilidad o cuando -por falta de tiempo- no se pueden emplear medidas más
complejas.
Formula:
“Rango = Valor mayor – Valor menor”
14
VARIANZA
Como se dijo atrás, la variancia es el cuadrado de la desviación típica, así:
La primera para datos agrupados y la segunda para datos no agrupados, ambas
para un conjunto “muestras”, si se deseara usar la fórmula para un conjunto
población solo se tendría que agregar un -1 al número de elementos “n“
Donde:
• fi: frecuencia absoluta de cada clase, es decir, el número de elementos que
pertenecen a dicha clase.
• X: marca de clase. Es el punto medio del límite inferior y del límite superior.
• s2: varianza de la muestra.
• s: desviación estándar de la muestra.
• X̄: media de la muestra.
Es conveniente hacer algunas observaciones acerca de la definición de varianza,
según se considere una muestra o toda la población. Como ya se ha explicado, el
estudio de una población se realiza observando no todos sus elementos, sino,
tomando una muestra. Las medidas o valores calculados a partir de las muestras
se utilizan luego para representar o estimar los valores de la población en los que
estamos interesados. Con el propósito de establecer claramente si el cálculo ha
sido realizado para toda la población o para una muestra, se acostumbra indicar
con símbolos diferentes cada una de las situaciones. Comúnmente se utilizan
letras latinas mayúsculas o letras griegas para indicar los valores de la población y
letras latinas minúsculas para los valores calculados a partir de los datos de la
muestra (estimadores).
15
Además, es corriente emplear la letra N para indicar el número total de elementos
en la población y la n para representar el tamaño de la muestra. Seguidamente se
presentan los símbolos y definiciones para el promedio y la variancia, según se
refieran a la población o a una muestra:
Algo que llama la atención inmediatamente es que, al definir, se utiliza n-1 como
divisor en vez de n. Esto obedece al hecho de que, de acuerdo con la teoría de la
estadística, al dividir por n-1 se obtiene una mejor estimación del valor poblacional
(variancia de la población). Debe señalarse, sin embargo, que si la muestra es
grande no tiene importancia alguna usar n ó n-1 como divisor, ya que el resultado
numérico que se obtendrá será prácticamente el mismo; en cambio, si la muestra
es pequeña, entonces sí es importante el usar la fórmula apropiada, o sea, la
correspondiente a s2 (minúscula).
DESVIACIÓN ESTÁNDAR
Es una medida de centralización o dispersión para variables de razón (ratio o
cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación
típica es una medida (cuadrática) que informa de la media de distancias que
tienen los datos respecto de su medida aritmética, expresada en las mismas
unidades que la variable.
16
Ejemplo
Calcular la desviación media en base a la siguiente tabla sobre las calificaciones
de un estudiante en 12 asignaturas evaluadas sobre 10.
Calificación Cantidad de asignaturas
6 5
7 4
8 3
9 2
10 1
Total 12
Se calcula la media aritmética.
Se llena la siguiente tabla:
17
Se emplea la ecuación de la desviación media.
Bibliografías
• ‘PROBABILIDAD Y ESTADÍSTICA PARA INGENIERÍA Y CIENCIAS’
Walpole Myers Myers ye 8va Ed, Pearson. Prentice Hall. University of
Texas at San Antonio
• Ronald E. Walpole; Raymond H. Myers Sharon L. Myers "Probabilidad y
Estadistica para Ingenieros" 6a Ed. 1999. Editorial Pearson
• Jay L. Devore "Probabilidad y Estadistica para Ingenieria y ciencias" 6ta Ed.
2006
18