100% encontró este documento útil (1 voto)
2K vistas235 páginas

Estadistica Basica Libro

Este documento presenta una introducción a la estadística. Explica que la estadística estudia el comportamiento de fenómenos de masa y características generales de colectivos, no de casos individuales. Distingue entre estadística descriptiva, que describe fenómenos, e inferencial, que realiza predicciones e inferencias. Presenta definiciones de estadística de diferentes autores y conceptos clave como población, muestra, variables y atributos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
2K vistas235 páginas

Estadistica Basica Libro

Este documento presenta una introducción a la estadística. Explica que la estadística estudia el comportamiento de fenómenos de masa y características generales de colectivos, no de casos individuales. Distingue entre estadística descriptiva, que describe fenómenos, e inferencial, que realiza predicciones e inferencias. Presenta definiciones de estadística de diferentes autores y conceptos clave como población, muestra, variables y atributos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA

BÁSICA

Ing. Colón Govea L., [Link].

1
PREFACIO

El libro Estadística Básica ha sido desarrollado con el


propósito de coadyuvar al aprendizaje de la estadística. Se
ha estructurado en forma sencilla, con el propósito de
inducir en el estudiante y lector un conocimiento práctico
de ciertos fundamentos estadísticos que se detallan en
forma muy ampliada en otras publicaciones, pero que aquí,
se justifica su concreción por los siguientes motivos.

a. Entregar una publicación en forma comprensible


aún para los que no poseen una sólida formación
estadística.

b. Presentar procedimientos sistematizados y


simplificados en la resolución de los cálculos
numéricos.

c. Introducir al alumno en la comprensión de la


necesidad y oportunidad de la aplicación de
procedimientos estadísticos no sólo en la ciencia
sino también en la tecnología y en las distintas
ramas del saber.

En el desarrollo de los contenidos, de ninguna manera se


prescinde del rigor científico, que para efectos de una
investigación más profunda debe considerarse. El propósito
es proporcionar al estudiante una obra de consulta práctica
y objetiva de los fundamentos y métodos matemáticos, que

2
puedan convencerlo de que se trata de una materia que
puede aprender y llegar a dominar para la solución de sus
problemas profesionales.

3
CONTENIDO
Pág.

1.0 INTRODUCCIÓN A LA ESTADÍSTICA 1


1.1 Estadística Descriptiva 3
1.2 Estadística Inferencial 6
1.3 Población 7
1.4 Muestra 8

2.0 TIPOS DE VARIABLES. 11


2.1 Variables y Atributos 11

3.0 DATOS ESTADÍSTICOS 19


3.1 Ordenación de datos por agrupación 20
3.1.1 Distribución de frecuencias. 21
3.2 Tabla de Frecuencia Tipo A 23
3.3 Ordenación de los datos por agrupación 26
3.4 Tabla de Frecuencia Tipo B 28
3.5 Distribución de frecuencias por agrupación 29
3.6 Características de las tablas tipo B 33

4.0 GRAFICAS DE FRECUENCIAS. 36


4.1 El histograma 36
4.2 El polígono de frecuencias 38
4.3 Las barras 39
4.4 Los gráficos circulares 41
4.5 Las curvas 41

5.0 MEDIDAS DE TENDENCIA CENTRAL 43


5.1 Media aritmética 43
5.1.1 Media aritmética simple sin agrupar. 45
5.1.2 Media aritmética de una serie estadística 46

4
Pág.

5.1.3 Media aritmética con datos agrupados 47


5.2 Mediana. 54
5.3 Moda 58
5.4 Media Geométrica 62
5.5 Media armónica 63
5.6 Media Cuadrática 64

6.0 MEDIDAS DE POSICIÓN 68


6.1 Cuartiles 69
6.2 Deciles 72
6.3 Percentiles 77

7.0 MEDIDAS DE DISPERSIÓN 81


7.1 Recorrido. 82
7.2 Desviación Media 82
7.3 Varianza 87
7.4 Desviación Estándar 88
7.4.1 Desviación típica de una serie estadística 89
7.4.2 Desviación típica de frecuencias 90
7.4.3 Desviación típica de una serie de intervalo 91
7.5 Coeficiente de Variación 93

8.0 MEDIDAS DE DISTRIBUCIÓN 97


8.1 Asimetría 97
8.2 Coeficiente de Curtosis 100

9.0 ANÁLISIS DE ASOCIACIÓN 104


9.1 Covariancia 105
9.2 Correlación 107
9.2.1 Diagrama de Puntos o dispersión 108

5
Pág.

9.3 Regresión Lineal Simple 112


9.4 La Regresión como ecuación predictiva 120

10.0 Análisis de varianza de la regresión simple 121

11.0 PROBABILIDAD 129


11.1 Espacio Muestral 133
11.2 Suceso o Evento 137
11.2.1 Tipos de sucesos o eventos 138
11.3 Probabilidad de sucesos 139
11.3.1 Suceso contenido en otro 139
11.3.2 Igualdad de sucesos 140
11.3.3 Unión de dos o más sucesos 131
11.3.4 Intersección de sucesos 142
11.3.5 Sucesos incompatibles 143
11.3.6 Sucesos complementarios o contrarios 144
11.3.7 Unión de sucesos complementarios 145

12.0 CÁLCULO DE PROBABILIDADES 147


12.1 Medición de la probabilidad 148

13.0 PERMUTACIONES, COMBINACIONES,


VARIACIONES 154
13.1 Permutaciones 155
13.2 Combinaciones 156
13.3 Variaciones 162
13.4 Combinaciones, Variación , Permutaciones 163

14.0 PROBABILIDAD CONDICIONADA 170

6
Pág.

15.0 PROBABILIDAD COMPUESTA 179

16.0 TEOREMA LA PROBABILIDAD TOTAL 182

17.0 TEOREMA DE BAYES 185

18.0 INDEPENDENCIA DE SUCESOS 188

19.0 DISTRIBUCIONES DE PROBABILIDAD 191


19.1 Distribuciones discretas y continuas 191
19.1.1. Distribuciones discretas: Bernoulli 192
19.1.2 Distribuciones discretas: Binomial 195
19.1.3 Distribuciones discretas: Poisson 199
19.1.4 Distribuciones Hipergeométrica 204
19.1.5 Distribuciones discretas: Multinomial 208
19.1.6 Distribuciones Multihipergeométrica 210
19.1.7 Distribuciones continuas: Uniforme 213
19.1.8 Distribuciones continuas: Normal 216

7
1.0 INTRODUCCIÓN A LA ESTADÍSTICA

Es la ciencia que estudia el comportamiento de los


fenómenos de masa e investiga las características generales
de un colectivo prescindiendo de las particularidades que
tuvieran cada uno de sus elementos. No se detiene a
analizar el comportamiento de un caso aislado; estudia
siempre grupos, conjuntos o colectivos de casos.

Existen casos de datos donde con frecuencia se encuentran


fenómenos en que no es posible predecir el resultado de un
caso aislado. Por ejemplo, una investigación usa el término
de población para definir el grupo de vehículos a motor
matriculados. Una investigación sobre los efectos de las
emisiones gaseosas en la generación de tumores
carcinógenos, definirá su población en relación a la
totalidad de personas que trabajan en las industrias de
hidrocarburos.

Cualquiera sea el punto de vista, lo fundamental es la


importancia científica que tiene la estadística, debido al
gran campo de aplicación que posee.

La Estadística no analiza el comportamiento de un caso


aislado; estudia siempre grupos, conjuntos o colectivos de
casos. Si estadísticamente se desea analizar un número de
repuestos defectuosos que recibe un taller de reparaciones,
la estadística inicia su trabajo seleccionando y examinando

8
un grupo numeroso de unidades y obtiene después, la
proporción de repuestos defectuosos.

En muchas ocasiones, cuando no se puede predecir el


resultado de casos aislados, se afirma que el resultado
depende del azar o que es concretamente aleatorio.

La Estadística tiene como propósito describir los


fenómenos, tales como, realizar predicciones o inferencias
sobre ellos. En el primer caso se aplica la Estadística
Descriptiva y en el segundo, se usa la Inferencia
Estadística.

Entre otros conceptos la Estadística cita los siguientes:

“La estadística es una técnica especial apta para el


estudio cuantitativo de los fenómenos de masa o
colectivo, cuya mediación requiere una masa de
observaciones de otros fenómenos más simples
llamados individuales o particulares”. (Gini, 1953).

Murria R. Spiegel, (1991) dice: “La estadística


estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para
sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis.

9
“La estadística es la ciencia que trata de la
recolección, clasificación y presentación de los
hechos sujetos a una apreciación numérica como base
a la explicación, descripción y comparación de los
fenómenos”. (Yale y Kendal, 1954).

Establecer una definición para la estadística resulta difícil.


El concepto de Estadística y sus aplicaciones directas o
indirectas es muy amplio. En todo caso, a la Estadística
incumbe la recogida, ordenación, resumen y análisis de
cualquier tipo de conjunto de datos o colectivos, lo que
significa que no tiene sentido pensar en un dato aislado o
individual como terreno de trabajo de la Estadística,
siempre analiza un grupo de elementos (personas, animales,
cosas, experimentos, etc.)

1.1 Estadística Descriptiva

Comprende el análisis y descripción de un conjunto de


datos, para obtener conclusiones sobre las características
y sus relaciones existentes con otras poblaciones, a fin de
compararlas. La estadística descriptiva tabula, representa
y describe una serie de datos que pueden ser
cuantitativos o cualitativos, sin sacar conclusiones.

La observación de los elementos de una población puede


ser exhaustiva o parcial. Es exhaustiva cuando la
observación se refiere a uno o todos los elementos de la

10
población; y, es observación parcial, cuando se refiere a
la descripción de los elementos de una muestra.
La estadística descriptiva considera en su análisis las
siguientes etapas:

a) Recolección de datos
b) Organización de datos
 Tabulación
 Graficación
c) Análisis y medición de datos.

Recolección de datos.

En la recolección de datos se consideran los siguientes


conceptos básicos:

Población: conjunto de observaciones efectuadas


Individuo: cada elemento de la población.
Atributo: es la característica que se investiga; puede ser
cualitativa como la calidad, condición, sexo, religión,
nacionalidad; o cuantitativa, como la resistencia, dureza,
estatura, peso, superficie.

Por ejemplo: Se aplica un estudio estadístico para


investigar la resistencia a la tracción de unos grilletes.

Población: conjunto de grilletes.


Individuo: cada grillete
Atributo: la resistencia a la tracción.

11
Organización de los datos

Puede hacerse por medio de la Tabulación a través de


una serie simple, o a través de la agrupación de datos,
este método se utiliza cuando el número de
observaciones es muy grande.

La organización de los datos puede hacerse también a


través de los gráficos de barras, sectores circulares,
mapas, curvas.

Los gráficos permiten visualizar e interpretar en forma


más clara el fenómeno que se estudia.

Análisis y medición de datos

Bajo este procedimiento se puede describir un conjunto


de datos y calcular algunas medidas que resumen la
información y que permiten establecer comparaciones.

El análisis y medición de datos se logra con el empleo de


las medidas de posición, entre ellas, la media aritmética,
la moda y la mediana.

También pueden utilizarse las medidas de dispersión


como la varianza y desviación estándar, las cuales, nos
dan información de la forma cómo están distribuidos los
datos.

12
1.2 Estadística Inferencial

Se fundamenta en el análisis de los resultados de una


muestra para inducir o inferir el comportamiento o
característica de la población a que pertenece. Infiere
propiedades de gran número de datos recogidos de una
muestra tomada de la población.

De acuerdo con Berenson y Levine; “Estadística


Inferencial son procedimientos estadísticos que sirven
para deducir o inferir algo acerca de un conjunto de
datos numéricos (población), seleccionando un grupo
menor de ellos (muestra)”.

Para establecer una diferencia entre la estadística


descriptiva y la inferencial, tenemos el siguiente
ejemplo:

Un ingeniero calcula el promedio del consumo de


gasolina por recorrido de un grupo automotor. En este
caso, la estadística por no describir el rendimiento del
grupo y por no hacer ninguna generalización de los
diferentes grupos, estaría utilizando la estadística
descriptiva.

Por el contrario, si el ingeniero decide utilizar el


promedio del consumo obtenido por uno de sus grupos
para estimar el consumo promedio en relación a otros
grupos, entonces, el proceso de estimación del promedio

13
sería un problema concerniente a la estadística
inferencial.

1.3 Población

Según Levin & Rubin (1996) “Una población es un


conjunto de todos los elementos que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones”. El
análisis estadístico siempre se refiere a un conjunto de
personas o cosas que denomina población; el término
población tiene un amplio significado y puede referirse a
personas, objetos, actos, áreas geográficas e inclusive al
tiempo. Una población se precisa como un conjunto
finito o infinito de personas u objetos que presentan
características comunes.

Las partes componentes de la población se conocen


como elementos, los cuales¸ pueden ser algo con
existencia real como un restaurante, una fábrica, un
sistema de tendido eléctrico, un repuesto, o algo más
abstracto, como la gravedad, la temperatura, un voto o el
intervalo de tiempo.

Los elementos de la población poseen ciertas


propiedades, rasgos o cualidades que se denominan
caracteres. Por ejemplo, el hombre posee unos caracteres
llamados estatura, peso, edad, estado civil, religión,
profesión, ingresos, formación académica, condición de

14
salud, etc. El flujo de un río tiene unos caracteres
llamados volumen o caudal, velocidad de flujo,
densidad, etc.

El tamaño de la población es un factor de gran


importancia en la investigación estadística. Este tamaño
viene dado por el número de elementos que la integran.
Así, ésta es finita cuando el número de elemento es finito
e infinito cuando consta de infinitos elementos.

Cuando la población es muy grande, es obvio que la


observación de todos los elementos se dificulte en cuanto
al trabajo, tiempo y costos necesarios para hacerlo. Para
solucionar este inconveniente se utiliza una muestra
estadística. En lugar de examinar el grupo entero
llamado población, se examina una pequeña parte del
grupo llamada muestra.

1.4 Muestra

Cuando se desarrollan investigaciones estadísticas, no es


posible obtener información sobre toda la población, de
aquí que solamente se investigue un subconjunto o
muestra de la misma.

El tamaño de la población es un factor de gran


importancia en la investigación estadística. Este tamaño

15
viene dado por el número de elementos que la integran.
Así, ésta es finita cuando el número de elemento es finito
e infinita cuando consta de infinitos elementos.

Se conoce como muestra a una parte de la población a


estudiar que sirve para representarla. La muestra se
define en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra sólo
podrán referirse a la población en referencia.

La muestra se caracteriza por ser representativa, contiene


las características relevantes de la población en las
mismas proporciones de la población donde fue tomada.
La población es un todo y la muestra es una fracción o
segmento de ese todo. Si se han de aplicar los resultados
de la muestra a la población entera, es fundamental que
la muestra a estudiar sea cuidadosamente seleccionada.
Una cobertura incompleta de la población conduciría a
un error, error de muestreo, pues de otra forma no puede
esperarse que la muestra sea representativa de la
población de manera exacta.

Al valor de una característica en la muestra se da el


nombre de estadígrafo o estadístico y al valor de esa
misma característica en la población se le llama
parámetro.

Un aspecto importante es el tamaño de la muestra. Este


está relacionado directamente con la precisión de los

16
resultados que se obtendrán. Cuanto mayor sea el
tamaño de la muestra estará más cerca del tamaño de la
población y sus resultados serán más precisos.

La importancia de estudiar muestras en lugar de


poblaciones, entre otras, es:

 El estudio de pocos individuos permite ahorrar el


tiempo.
 Disminución de los costos.
 Estudia de la totalidad de los elementos bajo una
característica determinada.
 Mejora la calidad de las observaciones y
mediciones realizadas a un reducido número de
individuos, antes que realizarlas a toda la
población.

Ejercicios.

Resuma los siguientes conceptos:

Estadística. Población. Elemento. Estadística descriptiva.


Estadística inferencial. Muestra. Variables categóricas.
Parámetro. Estadígrafo.
Diferencie estadística descriptiva de la inferencial.
Escriba ejemplos de casos que deben ser analizados bajo la
estadística inferencial.
Identifique en cuatro ejemplos lo que constituye la
población, individuo y atributo.

17
2.0 TIPOS DE VARIABLES.

2.1 Variables y Atributos

En una muestra o población se estudia una serie de


variables en cada individuo o elemento. Por lo
general, se estudia una a una las variables sin llegar
a plantearse ninguna asociación entre ellas. El
número de variables o datos de una muestra
determinan el tamaño de la muestra y suele
representarse con la letra n.

Es importante diferenciar que el dato individual es


un dato de un sólo individuo, mientras que el dato
estadístico es un dato de una muestra o de una
población en su conjunto. Por ejemplo, el consumo
eléctrico de la vivienda de Pedro es un dato
individual, mientras que el promedio del consumo
eléctrico de las viviendas del cantón o provincia es
un dato estadístico.

En una investigación, el primer problema que se


presenta en el análisis estadístico, es el de definir el
método más apropiado para resumir la información,
a fin de presentar lo más esencial de ella. Es
importante establecer la distinción que existe entre
dos tipos de información, los atributos y las

18
variables, toda vez, que ellas implican
procedimientos diferentes.

En una población los caracteres de los elementos son de


dos clases, cuantitativos y categóricos o cualitativos.
Los caracteres cuantitativos o variables son los que
describen mediante números la resistencia, la intensidad
de flujo de un caudal, el salario, la edad, las ventas, el
volumen, la distancia, las medidas ergonómicas.

Estas variables o caracteres cuantitativos difieren de


elemento a elemento, no se presentan con la misma
intensidad en cada uno de ellos, es decir, no todo
material tiene la misma resistencia, ni todo vehículo la
misma potencia. Por consiguiente, los individuos o
elementos de una población presentan distintos números,
que son los valores de la variable.

Los atributos son las propiedades de los fenómenos que


pueden ser medidos cualitativamente, expresan una
descripción cualitativa, no numérica. Los categóricos o
atributos se expresan mediante palabras como la
profesión, el estado civil, la condición de saludable o no
de una persona o el hecho de un producto ser o no
defectuoso. Puede notar que los atributos no se presentan
en la misma forma en todos los elementos. Estas
distintas formas en que se presentan los atributos reciben
el nombre de modalidades. Cuando un atributo tiene
distintas formas de presentación se conoce como

19
modalidad: Por ejemplo, la condición de funcionamiento
de los barcos pesqueros de Esmeraldas no presentan una
misma modalidad.

En las variables cualitativas y cuantitativas se puede


mencionar:

Ordinales
Cualititativas. Puras
Dicotómica

Discretas
Cuantitativas o numéricas Continuas

Las ordinales, son aquellas que teniendo más de dos


modalidades se enuncian siguiendo una cierta
ordenación ascendente o descendente y no de otra
manera. Por ejemplo, la variable gravedad de un
accidente de tránsito, podría tener como orden natural
entre sus modalidades leve, moderado, grave, etc.

Variable: Accidente de tránsito.


Escala: Leve
Moderado
Grave
Crítico
Muerte
Diferencia: Existe diferencia entre los diferentes niveles
de la escala, entre los accidentes leves con
los de nivel crítico o muerte.

20
Variable: Grado de militar y/o policial
Escala: Soldado
Sargento
Suboficial
Oficial
General
Diferencia: Existe diferencia entre los grados jerárquico
no solo en años de experiencia sino en años
de estudio.

Las variables cualitativas puras, carecen de un orden


natural preestablecido entre sus modalidades, y pueden
tener cualquier tipo de ordenación, como por ejemplo el
grupo sanguíneo o la nacionalidad de una persona.

En este tipo de variables se carece de un ordenamiento


previo, más bien es arbitrario, por ello se ha establecido
tres parámetros para entender mejor este tipo de escala;
variable, escala y diferencia, por ejemplo:

Variable: Profesión 
Escala: Ingeniero 
Médico
Abogado
Enfermero
Odontólogo
Diferencia: No existe diferencia entre los
profesionales.

Variable: Sexo
Escala: Masculino
Femenino

21
Diferencia: Ninguna.

Variable: Estado civil 


Escala: Soltero
Casado
Divorciado
Viudo
Unión estable
Diferencia: Ninguna.

Las dicotómicas, tienen sólo dos modalidades posibles


y no tiene sentido señalar si son o no ordinales. Ejemplo,
el sexo, el pertenecer o no a una asociación, o en general
cualquier situación que sólo admita una respuesta sí o
no.

Las variables cuantitativas son las propiedades de los


fenómenos que se pueden medir cuantitativamente. Los
caracteres cuantitativos o variables, son susceptibles de
medición. Son aquellos que pueden ser expresados
mediante números. Como por ejemplo, la densidad, el
peso, la estatura, el salario, la edad, etc. Se llama
constante, cuando la variable toma solamente un valor.

Cuando las variables toman diferentes valores para


representar los diferentes elementos de una población se
las conoce como valores de la variable.

22
Las variables cuantitativas se clasifican en discretas y
continuas. Las primeras sólo pueden asumir
determinados valores y no es posible que llegue a tomar
algún valor comprendido entre dos números
consecutivos; es un número entero que no admite
fracciones. Ejemplo, el número de motores de un taller.
El número de alumnos de un aula de clases.

Variable: Número de visitas 


Escala: De 1 a 3 visitas
De 4 a 6 visitas
De 7 a 9 visitas
De 10 a 12 visitas
Amplitud: Entre 1 y 3, existe una amplitud de 2

Variable: Número de caries dental 


Escala: De 1 a 3 caries
De 4 a 6 caries
De 7 a 9 caries
Amplitud: Entre 1 y 3 caries, existe una
amplitud de 2 caries

Las variables continuas pueden tomar cualquier valor en


un intervalo de los números reales. La velocidad de
recorrido por hora de un vehículo. El peso de una
persona, etc.

Variable: PESO EN GRAMOS 


Escala: 6,5 Kg

23
7,5 Kg
8,5 Kg
9,5 Kg
Amplitud: Entre 6,5 y 9,5 kg existe una amplitud de 4,0
kg.

Variables Independientes y Variables Dependientes

Si a cada valor de X le corresponde uno o más valores de


la variable Y, entonces, Y es una función de X, y se
representa por:

X será la variable independiente Y la dependiente.

Por ejemplo, la torsión T de un eje es función de su


resistencia R.

Ejemplo de identificación de variables:

Descripción de la variable Identificación


Tiempo de funcionamiento de Cuantitativa,
un motor continua.
Distancia recorrida por un Cuantitativa,
vehículo. continua.
Ingreso de visitas al taller. Cuantitativa,
discreta.
24
Cantidad de motores Cuantitativa,
Color de una dínamo
eléctricos. Categórica.
discreta.
Preferencia
circuitado. por la marca de Categórica.
un repuesto.
Estatura de los empleados. Cuantitativa
continua.

25
3.0 DATOS ESTADÍSTICOS

Los datos estadísticos pueden ser el resultado de un censo o


de una muestra. Es de un censo cuando las características
observadas se la han realizado sobre todos los elementos de
la población, pero si se ha tomado de una parte de ella, se
trata de una muestra.

Es importante insistir que sólo se podrán hacer estimaciones


confiables cuando las características de los elementos de la
muestra sean representativas de las características de la
población de donde se tomó.

Todo dato estadístico es el resultado de las observaciones


realizadas a las personas o cosas que ocasionan el
fenómeno que se va ha estudiar.

Para lograr una buena descripción y análisis con los datos,


éstos deberán ordenarse y clasificarse antes de que se
realice su recopilación.

Si se desea conocer el comportamiento de un grupo de


barras metálicas debe hacérselo sobre la base de: tipo de
material, dimensiones, densidad, etc.

En un censo de población a las personas se les toma datos


sobre: nombres, apellidos, edad, origen, lugar donde vive,
ingresos económicos, etc.

Durante la recolección de datos se consideran los conceptos


de población, individuo y atributos (que pueden ser

26
cualitativos o cuantitativos). Por ejemplo: se desea realizar
un estudio de las densidades de maderas de un bosque.

 Población: Conjunto de densidades


 Individuo: cada densidad
 Atributo: la densidad.

En cuanto a la organización de los datos, éstos pueden ser


tabulados a través de una serie simple o por medio de su
agrupación. La agrupación se emplea para los casos cuando
las observaciones son muy grandes.

3.1 Ordenación de los datos por agrupación o


distribución de frecuencias.

Bajo este método se registran las frecuencias de cada


valor de la variable y se determina la frecuencia
absoluta, frecuencia relativa, frecuencia relativa en
porcentaje, frecuencia acumulada y frecuencia
acumulada en porcentaje.

La Frecuencia absoluta expresa el número de veces que


la variable u observación toma un cierto valor; mientras
que la frecuencia relativa se establece por el cociente
entre la frecuencia absoluta de cada valor de la variable
dividida por el total de observaciones.

27
3.1.1 Distribución de frecuencias.

Con el fin de poder identificar el comportamiento


característico de un fenómeno y facilitar el análisis
exhaustivo de los datos, se procede a estudiar el
comportamiento de las variables y conocer su
distribución, describiendo y entendiendo la forma
como varían los valores de la característica estudiada
en los individuos de la muestra o población.

La distribución de una variable entrega información


sobre los valores que una variable puede tomar en los
individuos observados y la frecuencia con que estos
valores ocurren.

Al conjunto de datos o variables, de valor cualitativo o


cuantitativo, que tiene cada elemento de la muestra se
denomina distribución. La forma de simplificar los
datos que equivale a las veces que se repiten, nos
conduce a la definición de los siguientes conceptos:

Frecuencia: es el número de veces que se presenta


cada valor de la variable

Frecuencia absoluta (f) es el número de veces que el


valor de una variable aparece dentro de un conjunto de
datos. Por ejemplo, si una muestra recoge la densidad
de algunos minerales y dentro de ella, la del cobre se
repite 20 veces, ésta será la f y n corresponderá al

28
tamaño total de la muestra, o sea, a la totalidad de
todos los minerales observados.

La totalidad de los datos (n) equivale a la sumatoria de


las frecuencias absolutas. Matemáticamente se expresa:

Frecuencia relativa (fi) equivale al valor de la


frecuencia absoluta de la variable dividida por la
totalidad de datos o tamaño muestral (n). Del ejemplo
anterior, si f es 20 y el tamaño total muestral n es 100,
es decir, el total de los minerales observados, entonces
fi = 20/100 = 0.2

Las frecuencias relativas, por lo general, se expresan


como porcentajes, que en nuestro caso es de 20% en
relación al total.

Las frecuencias absolutas y relativas son aplicables a


cualquier tipo de variable, y de ahí su importancia;
además, pese a su simplicidad, dan lugar a conceptos
muy importantes, como el de proporción, y son la base
sobre la que se construye cualquier resumen de los
datos.

29
En toda investigación estadística se llega a la
acumulación de valores cuantitativos y cualitativos
correspondientes a los diversos valores de las variables
que se pueden resumir en lo que se conoce como tablas
de frecuencia. Luego, las tablas de frecuencia, es el
procedimiento de simplificación de los datos que
agrupan diversos valores de una variable.

Tabla de frecuencias: es una tabla que presenta en


forma ordenada los distintos valores de una variable y
sus correspondientes frecuencias.

Para entender como funcionan, analizaremos dos tipos


de tablas de frecuencia.

3.2 Tabla de Frecuencia Tipo A

Se pide a una comisión técnica que valore el concurso de


merecimientos de los profesionales que participan para
el ingreso a una empresa con la siguiente escala de
puntuación: Excelente (6), Muy Bueno (5), Bueno (4),
Regular (3), Malo (2) y Muy Malo (1)

Los resultados de la calificación para diez concursantes


fueron:

30
Profesional Nivel El cuadro expone la
1 5 calificación para cada
2 2 concursante.
3 4
4 3 Luego, se simplifican y
5 5
se interpretan los
6 5
7 4 datos.
8 3
9 5
10 4

Nivel de Frecuencia
calificaciónComo en(f)la
1 catalogación 0 de los
2 datos la amplitud
1
3 presenta una 2
4 3
distancia o variación
5 4
6 0
Total… 10

Los miembros de la comisión técnica no valoraron a los


profesionales ni como Malos ni como Excelentes;
mientras que la mayoría de los profesionales se
valoraron como Muy Bueno y Bueno.

31
Obsérvese en el cuadro anterior que la sumatoria de las
frecuencias es igual al número de profesionales
concursantes.

El análisis de las tablas de frecuencia se complementa


con la frecuencia relativa (fi), frecuencia acumulada (fa)
y frecuencia relativa en porcentaje (fi%) y acumulada en
porcentaje (fa%). Las frecuencias absolutas y relativas
son aplicables a cualquier tipo de variable, a más de su
simplicidad permiten establecer la proporción de los
datos.

Nivel de Frecuencia fa fi fa%


calificación (f)
1 0 0 0,0 0,0
2 1 1 0,1 0,1
3 2 3 0,2 0,3
4 3 6 0,3 0,6
5 4 10 0,4 1,0
6 0
Total… 10 1,0

Ejemplo: De los datos de una encuesta de usuarios de


energía eléctrica sobre el consumo de Kw se obtuvieron
los siguientes datos:

32
37 20 58 39 41 25 27 32 31 28
20 43 37 40 32 31 18 25 37 29
49 47 34 35 32 21 43 38 47 19
50 42 31 44 37 35 46 30 53 46

Ordenación de los datos (aparecen como


U=usuario, C=consumo) como una serie
simple:

U C U C U C U C
1 1 1 3 2 3 3 4
2 18 1 30 21 37 31 43
3 29 12 31 2 37 32 4
4 20 13 31 23 37 3 46
5 20 14 31 24 37 34 46
6 21 15 32 25 38 35 47
7 25 16 32 26 49 36 47
8 25 17 32 27 40 37 59
9 72 81 43 82 14 83 05
1 28 29 35 39 42 49 53
0 0 0 5 0 3 0 8

3.3 Ordenación de los datos por agrupación o


distribución de frecuencias.

Bajo este método se registran las frecuencias de cada


valor de la variable y se determina la frecuencia
absoluta, frecuencia relativa, frecuencia relativa en

33
porcentaje, frecuencia acumulada y frecuencia
acumulada en porcentaje.

La Frecuencia absoluta expresa el número de veces que


la variable u observación toma un cierto valor; mientras
que la frecuencia relativa se establece por el cociente
entre la frecuencia absoluta de cada valor de la variable
dividida por el total de observaciones.

La distribución de frecuencia es la representación


estructurada, en forma de tabla, de toda la información
que se ha recogido sobre la variable que se estudia.

Si los valores que toma la variable son muy diversos y


cada uno de ellos se repite muy pocas veces, entonces
conviene agruparlos por intervalos, ya que de otra
manera obtendríamos una tabla de frecuencia muy
extensa que aportaría muy poco valor a efectos de
síntesis.

Distribución de frecuencias de datos simples.

f fi fi % fa fa %
18 1 0,025 2,50 1 2,50
19 1 0,025 2,50 2 5,00
20 2 0,050 5,00 4 10,00
21 1 0,025 2,50 5 12,50
25 2 0,050 5,00 7 17,50
27 1 0,025 2,50 8 20,00
28 1 0,025 2,50 9 22,50
29 1 0,025 2,50 10 25,00

34
30 1 0,025 2,50 11 27,50
31 3 0,075 7,50 14 35,00
32 3 0,075 7,50 17 42,50
34 1 0,025 2,50 18 45,00
35 2 0,050 5,00 20 50,00
37 4 0,100 10,00 24 60,00
38 1 0,025 2,50 25 62,50
39 1 0,025 2,50 26 65,00
40 1 0,025 2,50 27 67,50
41 1 0,025 2,50 28 70,00
42 1 0,025 2,50 29 72,50
43 2 0,050 5,00 31 77,50
44 1 0,025 2,50 32 80,00
46 2 0,050 5,00 34 85,00
47 2 0,050 5,00 36 90,00
49 1 0,025 2,50 37 92,50
50 1 0,025 2,50 38 95,00
53 1 0,025 2,50 39 97,50
58 1 0,025 2,50 40 100,00
40 1 100

3.4 Tabla de Frecuencia Tipo B

Se emplean estas tablas cuando los datos observados son


numerosos y la amplitud de los valores de las variables
es considerable. Se toma a la amplitud como la
diferencia entre el menor y el mayor valor de la
observación.

35
Debido a los datos numerosos se hace necesario
agruparlos en Intervalos de Clase. La agrupación de los
valores de la variable en intervalos de clase permitiría
simplificar las fuentes de datos. Por ejemplo, si
tuviéramos una valoración de 1 a 75, podríamos
establecer intervalos de clase entre 0-15, 15-30, 30-45,
45-60 y 60-75.

3.5 Distribución de frecuencias por agrupación de


datos

Para aplicar este procedimiento es importante definir los


siguientes conceptos:

Amplitud total o recorrido de la variable (A).- Se la


define como la diferencia que existe entre el valor
mayor y el valor menor de las observaciones.

A = Obmayor – Obmenor

Intervalo de clase.- Comprende los números extremos y


los incluidos entre ellos. Por ejemplo: se tiene un
intervalo de 60 – 64

60 64
61 – 62 – 63

36
Límites de clase.- Está formado por los números
extremos que forman el intervalo de clase. Los límites de
clase en el anterior intervalo serian 60 y 64. Sin
embargo, los límites reales se obtienen restando 0.5 al
límite inferior (Li) y sumando 0.5 al límite superior (Ls).

Límite inferior: 59.5

Límite superior: 60.5

Ancho del intervalo (I).- El ancho del intervalo o


intervalo de clase se lo obtiene por la diferencia entre el
límite real superior (Lrs) menos el límite real inferior
(Lri).

I = lrs - lri

I : ancho del intervalo

Lrs : limite real superior

Lri : limite real inferior

O también mediante lo siguiente: I = Ls – Li + 1

Marca de clase.- Es el valor medio de cada intervalo.

Mc = marca de clase

37
Li = limite inferior

Ls = limite superior

Número de intervalos.- Es un número entero que refleja


la totalidad de clases.

ni = número de intervalo
I = ancho del intervalo A
ni  1
A = amplitud I

Los intervalos deben ser no menor que 5 ni mayor a 15.


Con un número de 5 intervalos de clase las frecuencias
son muy concentradas. Cuando los intervalos son
mayores a 15 las frecuencias se presentan muy
dispersas, lo cual, dificulta su representación gráfica y
cálculos matemáticos.

Ejemplo de ordenación de los datos por agrupación o


distribución de frecuencias de la producción alcanzada
por setenta obreros, fue la siguiente:

51 49 45 56 49 46 45 40 38 61
36 65 55 50 50 45 47 43 37 65
45 45 45 50 51 56 39 61 55 52
49 47 41 52 49 41 60 79 36 42
50 51 49 48 55 67 ni36 A48 140 41
51 50 49 45 44 45 41 I37 66 57

38
49 34 45 65 70 54 50 46 37 41
Amplitud: A = 75 – 34 = 41
Ancho intervalo: I =6
Para establecer los intervalos de clase se procede:
Número de intervalos: ni = (41/6)+1≈8
a) Si los va ha ordenar en forma descendente, tome el
mayor valor de la observación asignándolo como el
límite superior del que será el primer Intervalo de clase,
de acuerdo con los datos anteriores, tenemos:

I = Ls – Li +1

De donde: 6 = 79 – Li + 1 74

Luego, el primer intervalo de clase estaría determinado


por aquellos que alcanzan una producción entre 74 – 79
y artículos.

El resto de intervalos lo deduce restando, sucesivamente,


el ancho del intervalo (I) tanto al límite inferior como al
superior.

INTERVALO f fa fi fi %
74 - 79 1 70 0,01 1,43
68 - 73 1 69 0,01 1,43
62 - 67 5 68 0,07 7,14
56 - 61 6 63 0,09 8,57
50 - 55 16 57 0,23 22,86
44 - 49 23 41 0,33 32,86
38 - 43 11 18 0,16 15,71

39
32 - 37 7 7 0,1 10
Totales 70 1 100
3.6 Características de las tablas tipo B

 Utiliza en el cálculo las marcas de clase.


 Los valores asumidos por las variables son
elevados.
 Sólo se utilizan variables cuantitativas (discretas
y continuas).
 Su elaboración tiene mayores procedimientos que
las tablas Tipo A.
 La interpretación y análisis se centra en los
intervalos de clase.
 Presenta un componente adicional: las marcas de
clase.

EJERCICIOS.

1. Completar los datos que faltan en la siguiente tabla


estadística, donde f, fa y fi representan, respectivamente, la
frecuencia absoluta, acumulada y relativa:
x f fa Fi
1 4 0,08
2 4
3 16 0,16
4 7 0,14
5 5 28
6 38
7 7 45
8

40
2. La frecuencia relativa de 1 es 0,08 = 4/N, de donde N =
50. Complete la frecuencia y frecuencia absoluta de la
observación de 3.

X f fa fi
1 4 4 0,08
2 4 8 0,08
3 0,16
4 7 23 0,14
5 5 28 0,10
6 10 38 0,20
7 7 45 0,14
8 5 50 0,10

3. Construya una tabla de frecuencias con los datos de


màxima temperatura que se registrò en la ciudad.

29, 30, 32, 28, 29, 31, 34, 28, 31, 33, 29, 30, 30, 31, 31, 30,
29, 29, 34, 33, 33, 29, 29. 30, 32, 31, 31, 30, 30, 29, 30, 31

4. La resistencia a dureza de 65 piezas se registran en la


siguiente tabla. Construir la tabla de frecuencias.

Dureza 51-60 61-70 71-80 81-90 91-100 101-110


f 10 7 12 9 14 11

41
5. Un tornero observa el número de fallas por lotes de
producción de las piezas elaboradas, la cual, se registra en
la siguiente tabla.

Lotes Fallas f fi
1 8 8 0,17
2 10 15 0,31
3 5 p1 p2
4 4 9 0,19
5 6 11 0,23
6 3 5 0,10

42
4.0 GRAFICAS DE LAS DISTRIBUCIONES DE
FRECUENCIAS.

Las distribuciones de frecuencias no sólo se representan en


tablas sino también en gráficos. Los gráficos permiten
facilitar la comprensión de los resultados, puestos que,
fundamentalmente, representan las frecuencias de cada
modalidad o valor, pero no añade ninguna información
sobre la que contendría una tabla de frecuencias. Hay dos
formas de representar las distribuciones de frecuencias, por
medio de un histograma o por un polígono de frecuencias.

En las gráficas las áreas (o longitudes) han de ser


proporcionales a las frecuencias y los detalles deben ser lo
suficientemente visibles. Se recomienda no representar
demasiada información en una gráfica

Los datos de las variables u observaciones pueden


adecuadamente también expresarse mediante gráficos, tales
como: barras, sectores circulares, mapas, curvas, etc.

4.1 El histograma se utiliza para representar una tabla


de frecuencias de intervalos de clase. Es la gráfica
adecuada para representar variables cuantitativas
continuas, en muchas ocasiones estos histogramas son
llamados erróneamente diagramas de barras.

43
Sobre el eje horizontal (X) se representan los intervalos
de clase y sobre el eje vertical (Y), las frecuencias de los
intervalos de clase.

El histograma consiste en un conjunto de rectángulos


adyacentes cuya base (todos ellos con base de igual
amplitud) representa un intervalo de clase y cuya altura
representa la frecuencia absoluta o relativa de acuerdo
con la distribución de frecuencias del intervalo que
estemos representando. En la base del rectángulo, bien
puede colocarse el intervalo o su punto medio de clase.

No obreros

Producción
Histograma de la producción media de setenta obreros

44
4.2 El polígono de frecuencias Es Empleado con variables
cuantitativas, tanto discretas como continuas, partiendo
del diagrama de columnas, barras o histograma, según el
tipo de tabla de frecuencia manejada.

El polígono se construye uniendo los puntos medios de


los lados superiores de cada rectángulo. Si se quiere
cerrar el rectángulo, se agregan dos intervalos: uno
anterior y otro posterior al último y se prolonga el
polígono hasta los puntos medios de estos intervalos.

# Obreros

Producción
Polígono de frecuencias de la producción media de setenta obreros

45
4.3 Las barras se utilizan generalmente para representar
atributos cualitativos o cuantitativos discretos. La
longitud es igual a la frecuencia de cada observación.
Pueden ser barras simples o múltiples, según se trate de
representar uno o más atributos. Las barras pueden ser
horizontales o verticales.

Los diagramas de barras asocian a cada modalidad de


una variable a un rectángulo y la superficie refleja su
frecuencia. Las bases de los rectángulos son todas
iguales; pero, las alturas corresponden a las frecuencias.

Ejemplo:

Producción de PETROINDUSTRIAL el 16 de diciembre


de 2008

LPG 6.575
Jet A-1 3.921
Asfalto C-20 7.239
Resido 10.329

En el ejemplo de los gráficos de barras vertical y


horizontal los rectángulos van separados.

46
Producción total diaria en barriles
(16-dic-2008)

47
4.4 Los gráficos circulares o gráficos de torta se
emplean para comparar datos. Cada sector del gráfico
representa el porcentaje que corresponde a la frecuencia de
un cierto valor de la variable. Ejemplo: Producción de azúcar
(Año 2007) en miles de sacos de 50 Kg de los siguientes
ingenios:

Ingenio Producción Porcentaje


San Carlos 3.322 34.39
Ecudos 3.159 32.70
Valdez 3.180 32.91

4.5 Las curvas se utilizan generalmente para representar la


variación de una variable a través del tiempo (años, meses,

48
horas, etc.). Sobre el eje horizontal figuran los períodos de
tiempo.

Precipitación
Año 2003
(mm)
Enero 197,7
Febrero 186,9
Marzo 133,1
Abril 68,2
Mayo 133,0
Junio 39,7
Julio 1,4
Agosto 20,4
Septiembre 41,9
Octubre 24,4
Noviembre 43,6
Diciembre 45,2

49
5.0 MEDIDAS DE TENDENCIA CENTRAL.

Las medidas o parámetros de centralización, conocidos


también como medidas de tendencia central o posición
central, permiten encontrar un valor lo más representativo
posible de todos los valores de la muestra, es decir, se
utilizan para encontrar un valor que represente a todos los
datos.

El valor que represente a todos los datos no será el valor


más elevado ni el valor más pequeño, lo más adecuado, es
entonces buscar un valor central que represente al grupo
antes que al individuo.

Las medidas de tendencia central permiten resumir la


localización de los datos, ubicando el punto alrededor del
cual se centran los mismos.

Las medidas más utilizadas son:

 Media aritmética
 Mediana
 Moda
 Media geométrica
 Media armónica

5.1 Media aritmética

La media es la medida de tendencia central más utilizada


y puede definirse como el promedio aritmético de una

50
distribución. Se calcula sumando los valores de los
datos y dividiendo su resultado para la cantidad de ellos.

Si los datos provienen de la población el promedio se


representa por la letra griega µ; si lo es de una muestra,
por

La media aritmética o promedio ( ) se calcula sumando


todas las observaciones y luego dividiendo el total entre
el número de elementos observados.

El símbolo ∑ indica que debe efectuarse una sumatoria,


X es el símbolo de una puntuación y N es el número total
de casos o puntuaciones.

La sumatoria es un símbolo muy utilizado en


matemáticas que sirve para simplificar fórmulas
estadísticas. Una sumatoria nos permite representar
sumas muy grandes, de n sumandos o incluso sumas
infinitas y se expresa con la letra griega sigma (Σ).

Por lo general, después de una sumatoria aparece una


variable con un suscrito representado por la letra i (ΣXi).
Este suscrito indica qué valores de la variable se deben
sumar, Para determinar cuáles valores, es necesario
sustituir la i por los valores que se indican arriba y
debajo de la sumatoria

51
Los datos provenientes de las poblaciones o muestras
pueden ser tratados de dos formas: sin agruparlos o
agrupándolos en tablas de frecuencias.

5.1.1 Media aritmética simple con datos sin


agrupar.

Es la suma de todos los elementos de la serie dividida


por el número de ellos. Se calcula como:

siendo:

x : la media
k

x
i 1
i : suma de elementos

n : número de elementos (incluyendo a los de igual


valor)
k : número de elementos con distinto valor.

Ejemplo.

1. Hallar el promedio de los datos correspondientes a


espacios en km recorridos por vehículos.

120, 50, 200, 80, 174, 180, 130

52
2. La media de 5 elementos se sabe que es 15.
Sabiendo que cuatro de ellos son: 10, 7, 20, 25 hallar el
elemento que falta.

3. Ejemplo: determine la media aritmética de los


amperajes de un grupo de motores: 3.5, 3.6, 3.7, 3.8,
3.9, 4.0, 4.2, 4.3, 4.4, 4.9

3.5  3.6  3.7  3.8  3.9  4.0  4.2  4.3  4.4  4.9 40.3
X  
10 10

5.1.2 Media aritmética de una serie estadística de


frecuencias o media aritmética ponderada.

Se define como la suma de los productos de cada


elemento de la serie por su frecuencia respectiva,
dividida por el número de elementos de la serie.

La fórmula matemática para calcular la media o


promedio para casos agrupados es:

53
Donde ni corresponde al número de observaciones o
frecuencias de cada valor.

Ejemplo: determinar la media aritmética del esfuerzo de


torsión para los datos encontrados en los siguientes
motores: 280, 220, 278, 250, 260, 220, 250, 278, 280, 260,
250, 250

x f
280 2
278 2
20 2
250 4
220 2

X
 2 280   2 278   2 260   4 250   2 220  3076  256
22242 12

5.1.3 Media aritmética con datos agrupados en una


serie estadística de intervalos de frecuencia.

Para la resolución de la media aritmética con datos


agrupados en intervalos de frecuencia se tienen tres
métodos.

Primer Método

El procedimiento establecido para resolver los cálculos


bajo este método se resume en:

54
a. Se establecen los intervalos de clase.
b. Para cada intervalo se sacan las frecuencias absolutas.
c. Se deduce los puntos medio de clase.
d. Se multiplica b y c.
e. Se hace la sumatoria de los productos de los puntos
medios de clase por sus frecuencias absolutas
respectivas.
f. Se divide la sumatoria obtenida para el número de
observaciones.

Fórmula que se emplea:

Ejemplo: calcular la media aritmética, en miles de


libras por pulgada cuadrada, de 40 muestras de varios
tipos de aluminio, después de haber sido sometidas a
un ensayo de máxima tensión.

16 32 27 42 28 34 44 22 18 38
22 40 16 20 42 36 40 42 32 16
36 18 34 25 38 27 20 25 36 34
27 38 36 44 22 32 16 40 27 20

A = 44 – 16 = 28
I = Ls – Li +1
I =5

55
5 = 44 - Li +1
Ni = A/I = 28/5 = 5.6 ≈ 6
Li = 40
Mc= Punto medio de clase.

X f Mc f*Mc
40 – 44 8 42 336
35 – 39 7 37 259
30 – 34 6 32 192
25 – 29 7 27 189
20 – 24 6 22 132
15 – 19 6 17 102
Total……. 40 1210

Ejemplo.

Una distribuidora de energía eléctrica en la venta de los


datos que se registran en el cuadro, tuvo en promedio una
pérdida del 25%. ¿Cuánto representó la pérdida, si el precio
del Kw/h fue de $ 0.75?

Cons 1200 2300 1600 1010 2540 1800 1540


Kw/h 900 2400 650 740 1200 848 1900

Segundo Método.

56
El procedimiento de resolución es el siguiente:

a. Repítase los pasos a, b y c del procedimiento


del Primer Método.
b. Escoja el punto medio de clase que tenga la
mayor frecuencia absoluta y lo denominamos
punto medio de clase supuesto Mcs.
c. Se calcula u con la siguiente fórmula:

d. Finalmente, multiplica las frecuencias absolutas


por u.

La fórmula es:

e.

Bajo este método resolveremos el mismo


ejercicio del caso anterior.

57
X f Mc Mcs u f*
u
40 – 44 8 42 42 0 0
35 – 39 7 37 -1 -7
30 – 34 6 32 -2 -12
25 – 29 7 27 -3 -21
20 – 24 6 22 -4 -24
15 – 19 6 17 -5 -30
Total……. 40 -94

Aplicamos la fórmula:

Se obtuvo el mismo resultado con este método.

Tercer Método.

Su procedimiento de resolución es:

a. Repítase los pasos a, b y c del procedimiento


del Primer Método.
b. Seleccione en forma arbitraria cualquier punto
medio de clase y así obtendrá su punto medio
de clase supuesto Mcs.

58
c. Deduzca la desviación (d) restando a cada
punto medio de clase (Mc) el punto medio de
clase (Mcs).
d. Multiplique la frecuencia por la desviación.
e. La fórmula que debe emplear es:

Para efectos de comprobación de la consistencia del


método, utilizaremos los mismos datos que hemos
empleado, a fin de obtener el mismo valor de la media.

X f Mc Mcs d f*d
40 – 44 8 42 10 80
35 – 39 7 37 5 35
30 – 34 6 32 32 0 0
25 – 29 7 27 -5 -35
20 – 24 6 22 -10 -60
15 – 19 6 17 -15 -90
Total……. 40 -70

Aplicando la fórmula:

59
Con los tres métodos hemos logrado el mismo
resultado.

EJERCICIOS.

1. Considérense los siguientes datos: 7, 12, 23, 10, 6, 2. Se


pide:
a. Calcular su media.
b. Si los todos los datos anteriores los multiplicamos por
3, cuál será la nueva media.

2. A un conjunto de 5 números cuya media es 6.84 se le


añaden los números 12.5 y 6.4. ¿Cuál es la media del nuevo
conjunto de números?

3. Calcular la media de una distribución estadística que viene


dada por la siguiente tabla:

xi 59 72 47 60 79
f 6 15 32 25 12

4. Hallar la media de la distribución estadística de los datos de


la siguiente tabla.

x 8 -12 13-17 18-22 23-27 28-32


fi 7 8 5 10 4

60
5.2 Mediana.

Es el valor que divide una serie de datos ordenados en


dos partes iguales. El número de datos que queda por
debajo y por arriba de la mediana son iguales; eso hace
que la mediana sea el valor que está en el centro de la
distribución.

Cuando no existe un valor central se puede definir a la


mediana como la media aritmética de los valores
medios. Esto es, si el número de partidas es par, la
mediana es la media aritmética de los valores de las dos
partidas medias.

La mediana se calcula según los siguientes casos:

Caso 1. Mediana para datos no agrupados, con


número de datos impar.

Ejemplo: 2, 4, 6, 8, 10, 12, 14

Mediana = 8

Mediana para datos no agrupados, con número de


datos par.

Ejemplo: 3, 3, 4, 4, 6, 7, 7, 8

Mediana = 5

61
Caso 2. Mediana para datos agrupados.

Calcular la mediana a partir de la siguiente tabla de


frecuencia:

En este caso se calcula la Mediana de una serie con datos


agrupados sólo por frecuencias, pero sin agrupar en
intervalos.

Procedimiento:

 Se calcula la frecuencia acumulada.


 Se calcula número total de casos
dividiendo suma de frecuencias para 2.

 La variable de la frecuencia acumulada


inmediatamente superior al resultado del
paso anterior es la mediana.
X f fa f% fa%
5 3 3 6,5 6,5
10 7 10 15,2 21,7
15 8 18 17,4 39,1
20 5 23 10,9 50,0
25 10 33 21,7 71,7
30 8 41 17,4 89,1
35 5 46 10,9 100,0
En 46 100,0
consecuencia, la frecuencia acumulada inmediata
superior a 23 es 33; luego, la mediana es la variable 25.

62
Caso 3. Mediana para una serie de datos agrupados
en intervalos.

En este caso se calcula la Mediana para una serie de


datos agrupados por frecuencias y en intervalos.

La mediana se calcula de la siguiente forma:

a. Se ordenan los valores en una tabla con intervalos


de clase, frecuencia absoluta y frecuencia
acumulada.
b. Se divide la sumatoria de frecuencias absolutas para
dos.
c. A este resultado se le busca el valor inmediato
superior en las frecuencias acumuladas, el cual, en la
línea de valores, nos indicará el intervalo de clase
que contendrá la mediana.
d. Al límite inferior de este intervalo de clases se le
obtiene el límite real inferior.
e. La frecuencia acumulada menor (fam) se encontrará
debajo del valor que señala el numeral 3 anterior.
f. Se calcula la frecuencia del intervalo que contiene a
la mediana mediante la fórmula de la mediana.

 f 
  fam 
Mn  Lri   2 . I
Ejemplo. 
Calcular la mediana f  de
a partir la siguiente
 
 
tabla de frecuencia:

63
Ejemplo: Se registró los amperajes de 30 motores de
potencia entre ½ HP hasta 3.0 HP funcionando bajo
corriente alternativa trifásica, siendo sus datos:

2 4,8 9,2 6,5 8,6 13 8,6 2,5 11 8,2


3 3,4 8,2 14,4 3 2 13 8,6 6,5 4,2
4,2 8,2 2,5 4,8 6,2 3,7 4,2 3,4 4,8 2
3 11 6,8 2,8 13 14 4,2 9,2 8,2 13

X f f
10,4 - 14,4 8 40
a
6,4 - 10,4 12 32
2,4 - 6,4 17 20
-1,6 - 2,4 3 3
40

 f 
  fam 
Mn  Lri   2 . I
 f 
 
 

64
5.3 Moda

Es el valor de la variable que tiene mayor frecuencia en


la muestra y puede definirse para cualquier tipo de
variables; es decir, el que se repite un mayor número de
veces. Es por tanto, el valor común.

En una distribución puede ocurrir que haya dos o más


modas, entonces se habla de distribución bimodal,
trimodal, incluso puede no existir la moda, como en la
serie 2, 3, 4, 5, 7, 10.

Ejemplo: Se presenta en forma ordenada de menor a


mayor las edades de una muestra de 12 jóvenes.

15 15 16 16 17 17 7 17 8 18 19 19

De los datos la edad o valor de 17 es la moda.

La moda en los datos sin agrupar la constituye el


conjunto de valores que ocurre con mayor frecuencia;
mientras que para datos agrupados es el intervalo de
clase con la frecuencia más alta.

Si los valores se encuentran en una tabla de frecuencias


para datos agrupados, el cálculo de la moda se obtiene
realizando la siguiente secuencia:

65
a. Determinar el intervalo en donde se encuentra la
clase modal, que corresponde al intervalo que posee
la mayor frecuencia.
b. Obtener el limite inferior de la clase modal (Li)

c. Obtener la amplitud del intervalo de la clase modal


(I)

d. Calcular la diferencia entre la frecuencia del


intervalo modal y la frecuencia del intervalo
contiguo inferior. (d1)

e. Calcular la diferencia entre la frecuencia del


intervalo modal y la frecuencia del intervalo
contiguo superior (d2)

Ejemplo.

Ejemplo (del Capítulo I Libro I) de ordenación de los datos por


agrupación o distribución de frecuencias de la producción
alcanzada por setenta obreros.

INTERVALO f fa Mc f *Mc
74 - 79 1 1 76,5 76,5
68 - 73 1 2 70,5 70,5
62 - 67 5 7 64,5 322,5
56 - 61 6 13 58,5 351
50 - 55 16 29 52,5 840
44 - 49 23 52 46,5 1069,5
38 - 43 11 63 40,5 445,5
66 32 - 37 7 70 34,5 241.5
70
Utilizando los datos de la tabla anterior, tenemos que:

a. La frecuencia absoluta de mayor valor es 23, que


corresponde al intervalo 44 - 49
b. Limite real inferior 43.5

c. La amplitud del intervalo es 6

d. La frecuencia absoluta del intervalo modal es 23


La frecuencia absoluta del intervalo contiguo
inferior es: 11, luego d1 = 23-11 = 12

e. La frecuencia absoluta del intervalo modal es: 23


La frecuencia absoluta del intervalo contiguo
superior es: 16, luego d2 = 7

Se obtiene que la moda sea:

d1 = 23 – 11 = 12

d2 = 23 – 16 = 7

67
Ventajas y desventajas de la moda

Ventajas

a. La Moda (al igual que la Me) se puede usar como


una localización central tanto para datos
cualitativos como cuantitativos.
b. La Moda (como la Me) no esta indebidamente
afectada por valores extremos, aún cuando los
valores altos sean muy bajos, se escoge el valor
más frecuente del conjunto de datos como el
valor modal.

c. Se puede usar la Mo aún cuando los intervalos de


clases están abiertos en sus extremos.

Desventajas

a. No siempre hay un valor modal


b. Cuando un conjunto contiene 2, 3 o más modas,
estas son difíciles de interpretar y comparar

68
5.4 Media Geométrica

La media geométrica de un conjunto de observaciones se


trata de la raíz enésima de su producto. El cálculo de la
media geométrica exige que todas las observaciones sean
positivas.

Los datos que emplea la media geométrica deben ser


todos números positivos. Si hay un número negativo la
media geométrica o bien negativa o bien inexistente en
los números reales. Cuando uno de los datos es 0,
entonces el resultado es 0.

G  n  X 1   X 2  X 3 .................. X n 

Donde:

G = media geométrica
n = numero de partidas de la muestra
x = valores de las partidas

69
5.5 Media armónica

Es la media aritmética de los recíprocos y se toma el


recíproco de esta media; o también, es el recíproco de la
media aritmética del recíproco de las observaciones.

Por lo general se emplea para promediar variables tales


como productividades, velocidades, tiempos,
rendimientos, cambios, etc.; no se recomienda en
distribuciones de variables con valores pequeños.

Entre las ventajas e inconvenientes que presenta es que


en el cálculo intervienen todos los valores de la
distribución; y, el cálculo no tiene sentido cuando algún
valor de la variable toma valor cero.

1 1 N
H  
1
X1
 1
X2
 ...............................  1
XN
 X  
1 1
X
N N

1

1
X1
 1
X2
 .............................  1
Xn

 x
1
H n n
Ejemplo:

Caso 1
obrero 2 corbatas por
obrero
a: 3 corbatas por
hora
b: hora

70
1.- considera al tiempo una constante y la producción un
variable.

(2+3)/ 2 = 2,5 corbatas por hora

Caso 2
obrero a: 30 minutos por corbata
obrero b: 20 minutos por corbata

2.- cuando __
se utiliza el tiempo como una variable debe
emplearse laX H

1 1
1 5
 30 20   24 Min / Corbata
H 2 120

5.6 Media Cuadrática

Es otra medida de tendencia central. Es muy útil cuando


las variables toman valores positivos y negativos. Se la
utiliza para obtener un promedio que no refleje los
efectos del signo, para lo cual, se elevan al cuadrado
todas las observaciones desapareciendo los signos

71
negativos. Es más alta que la media aritmética, y por
tanto que la geométrica y armónica.

La media cuadrática, es igual a la raíz cuadrada de la


suma de los cuadrados de los valores dividida entre el
número de datos.

Su fórmula es:

EJERCICIOS

1. Calcula la media, mediana y moda de esta distribución.

x f fa Fi
1 4 0,08
2 4
3 16 0,16
4 7 0,14
5 5 28
6 38
7 7 45
8

72
2. Observada la producción en miles de arandelas de un conjunto
de talleres, se han obtenido los siguientes datos:

Alquileres
en miles de ni
pesetas
1 - 15 24
16 – 30 86
31 – 45 136
46 - 60 46
61 - 75 12
76 - 90 4

Calcular la moda y la mediana.

3. Los jugadores de un determinado equipo de


baloncesto se clasifican por altura según la tabla
siguiente:

Altura 1,70-1,75 1,75-1,80 1,80-1,85 1,85-190


1,90-195 1,95-2,00
Número 1 3 4 8
jugadores 5 2

Se pide analizar la variable altura para la media, la moda


y la mediana.

Ejemplo: En una librería se registran la ventas y se


desea:

73
a. Obtener el precio medio por semestre.

b. Para el total de libros vendidos al año el precio


medio, el más frecuente y el que divide en dos
partes iguales la distribución de frecuencias.

Precio x f1 f2 x*f1 x*f2 f1+f2 x(f1+f2)


10 - 25 17,5 22 12 385 210 34 595
26 - 41 33,5 14 16 469 536 30 1005
42 - 57 49,5 25 22 1238 1089 47 2326,5
58 - 73 65,5 10 8 655 524 18 1179
71 58 2747 2359 129 5105,5

Precio medio en 1er semestre: 2746.5/71= 38.68 dólares

Precio medio en 2do semestre: 2359/58 = 40.67 dólares

Media aritmética:

Precio medio en el 1er


semestre: 2746.5/71= 38.68
Precio medio en el 2do
semestre: 2359/58 = 40.67

Media aritmética: 5105.5 / 129 = 39.58


dólares.

74
6.0 MEDIDAS DE POSICIÓN

Conocidas también como medidas de dispersión se emplean


para describir la variación o dispersión en un conjunto de
datos.

Lo constituyen indicadores estadísticos que muestran la


frecuencia acumulada hasta un valor k cualquiera. Son
valores de la muestra o población que puede tomar una
variable. Los valores se distinguen por agrupar a cierto
porcentaje de observaciones en la muestra o población.

Las medidas de posición, parámetros de posición o


cuantiles se caracterizan por ser medidas de posición, aun
cuando pueden ser considerados como medidas de
centralización o como medidas de dispersión.

Los cuantiles son valores de la distribución de un conjunto


de observaciones que la dividen en partes iguales, es decir,
en intervalos que comprenden el mismo número de valores.
Cuando la distribución contiene un número alto de
intervalos o de marcas de clase y se requiere obtener un
promedio de una parte de ella, se puede dividir la
distribución en cuatro, en diez o en cien partes.

El cuantil se define como el valor de la variable que puede


o no estar incluida en la muestra y que supera al % de los
datos de la muestra. Permite conocer la posición en que se
encuentra un valor dado en relación al conjunto de la
muestra o población.

75
Entre las medidas de posición se encuentran:

Los cuartiles dividen a la distribución en cuatro partes.


Los deciles dividen a la distribución en diez partes.
Los percentiles dividen a la distribución en cien partes.

6.1 Cuartiles

Son 3 valores que distribuyen la serie de datos, ordenada


de forma creciente o decreciente, en cuatro tramos
iguales por tres medidas cuartiles, en los que cada uno de
ellos concentra el 25% de los resultados.

El cuartil se representa por Qk

k = Número del cuartil 1, 2 o 3

Qk = q-ésimo del cuartil

a. Q1= Valor de la variable que es igual o menor al


25% de los valores de una variable.
b. Q2= Valor de la variable que agrupa el 50% de
los datos. Es idéntico a la mediana.

c. Q3= Valor de la variable que es igual o menor al


75% de los valores de una variable.

d. Q4 = Valor de la variable que agrupa el 100% de


los datos.

76
Ejemplo: De los datos registrados de los sueldos de
treinta trabajadores localizar los valores que
correspondan a los Cuartiles.

X f fa
240 1 30
235 2 29
225 3 27
Q3 200 5 24
195 3 19
Q2 185 2 16
180 3 14
175 2 11
Q1 170 5 9
165 4 4
Total……. 30

N: Es igual a la sumatoria de las frecuencias.

PK : Punto del cuartil correspondiente.

P1 = N/4 = 30/4 = 7,5 En relación a este valor


ubicamos en la columna de fa el valor inmediato
superior; esto es el 9.

Luego, el primer cuartil Q1 corresponde al valor


de la variable 170.

Q1 = 170

P2 = 2N/4 = (2 * 30)/4 = 15 Luego, Q2 = 185


77 P3 = 3N/2 = (3 * 30)/4 = 22,5 Luego, Q3 = 200
El procedimiento responde al cálculo de una serie
estadística de frecuencia.

Para el cálculo de Cuartiles de una serie estadística de


intervalos se lo hará con el siguiente ejemplo:

Las marcas en segundos (X) realizados por atletas en una


competencia de 10 000 m planos se agruparon en la
siguiente tabla:

X f fa
Q 46 - 49 18 54
Q 42 - 45 14 36
Q 38 - 41 10 22
34 - 37 6 12
30 - 33 4 6
26 - 29 2 2
Total……. 54

: Es igual a la sumatoria de las frecuencias.

facm: Frecuencia acumulada menor.

I: Ancho del intervalo.

P1 = /4 = 54/4 = 13,5 El valor inmediato superior

en la fa es el 22, luego el cuartil está en el intervalo 38


78
– 41 y se lo determina con la siguiente fórmula:

Q1 = Lri + [ (( N/4 ) – f acm )/ f ] * I


P1 = 13,5
Q1 = 37,5 + [(13,5 / 12) / 10] * 4 = 37,95

P2 = 2N/4 = (2*54) /4 = 27
Q2 = 41,5 + [(27 / 22) / 14] * 4 = 41,85

P3 = 3N/4 = (3*54)/4 = 40,5


Q3 = 45,5 + [(40,5) / 12) / 18] * 4 = 46,25

Resultados:

El 25% de los atletas hicieron 37,95 segundos o menos.


El 50% de los atletas hicieron 41,85 segundo o menos.
El 75% de los atletas hicieron 46,45 segundos o menos.

6.2 Deciles

Son medidas de localización que dividen un conjunto de


observaciones en diez partes iguales, por consiguiente,
habrán 10 deciles representado como dk.

Los deciles establecen nueve cortes para definir de diez


en diez por ciento los valores de la distribución; de tal
manera que el primer decil deja por debajo una décima

79
parte de la distribución, el segundo dos décimas partes,
etc., hasta nueve deciles.

k: Numeración de los deciles.

dk: Representa el decil correspondiente.

d1 = Valor de la variable que agrupa el 10% de los datos.

d2 = Valor de la variable que agrupa el 20% de los datos.

d3 = Valor de la variable que agrupa el 30% de los datos.

d4= Valor de la variable que agrupa el 40% de los datos.

d5= Valor de la variable que agrupa el 50% de los datos.

d6= Valor de la variable que agrupa el 60% de los datos.

d7= Valor de la variable que agrupa el 70% de los datos.

d8= Valor de la variable que agrupa el 80% de los datos.

d9= Valor de la variable que agrupa el 90% de los datos.

N = 10 deciles.

La fórmula para calcularlo es:

80
Donde:

Lri : Límite real inferior en el decil k.


Σf : Sumatoria de frecuencias.
fam : Frecuencia acumulada menor.
fdk : Frecuencia del decil k.
I : Intervalo de clase del decil k.

Ejemplo: Hallar los deciles de los datos registrados de


producción lechera en 125 granjas agropecuarias.

PRODUCCIÓN f fa Pk
95 - 99 4 125
90 - 94 7 121
80 - 84 12 114 P9
75 - 79 14 102 P8
70 - 74 19 88 P6
65 - 69 13 69 P5
60 - 64 16 56 P4
55 - 59 10 40 P3
50 - 54 15 30 P2
45 - 49 8 15 P1
40 - 44 5 7
35 - 39 2 2
Total…….. 125

81
Se procede a determinar la posición de los deciles:

P1= P6=

P2= P7=

P3= P8=

P4= P9=

Para cada uno de los valores encontrados de Pk se toma


en la columna de las frecuencias acumuladas (fa), el
valor inmediato superior.

Para P1=16,1 el valor inmediato mayor es 24, luego, en


esta posición se encontrará el decil uno (d 1) y
corresponderá a uno de los valores dentro del intervalo

82
de clase 85 – 89 que se lo determinará de la siguiente
manera:

dk=

d1= 44,5 +

d2 = 49,5 +

d3 = 54,5 +

d4 = 59,5 +

d5 = 64,5 +

83
d6 = 69,5 +

d7 = d6

d8 = 74,5 +

d9 = 79,5 +

6.3 Percentiles

Los percentiles son medidas de posición relativa que


dividen el conjunto de datos en cien partes iguales, son
como los deciles pero de uno en uno por ciento, y por
tanto son noventa y nueve. Los percentiles representan
los valores de la variable que están por debajo de un
Porcentaje. Ejemplo, el percentil 48 deja por debajo al
48% de la distribución.

Relacionando las medidas de posición, se tiene que la


mediana es el segundo cuartil, 5º decil y 50º percentil, así:
Mn=Q2= d5=P50. El percentil nos permite des-agregar más aún
la distribución que el decil.

84
Determinación de la posición del punto percentil, se lo
hace:

Pk =

Donde:
k: Valor del punto percentil 2, 3, 10, 30, 40, 50, etc.
Σf: Sumatoria de frecuencias.
La fórmula para calcular el valor percentil es:

Donde:
Vk: Valor del percentil que se busca.
Lri: Límite real inferior.
Pk: Punto percentil k.
f am: Frecuencia acumulada menor.
f: Frecuencia en el punto percentil.
I: Ancho del intervalo de clase.

Ejemplo: De un registro de la altura de reclutas de un


cuartel se está interesado en conocer el 25 o punto
percentil, 40o y 65o

ALTURA f fa
179 - 183 22 115

85
174 - 178 28 93 P65
169 - 173 15 65
164 - 168 32 50 P25
159 - 163 18 18 y
Total…… 115

V40 = V25 = 165,2

Respuesta:
Tanto el 25% como 40% del total de los reclutas tiene
una altura menor a los 165,2 cm: mientras que el 60% de
ellos tienen una altura menor a los 176,7 cm.

86
EJERCICIOS

En el estudio de un cierto fenómeno se obtiene la


siguiente tabla:
xi 7 10 12 16 19 20 21
ni 6 7 16 17 22 19 17

Calcular los quartiles Q1 y Q3 correspondiente.

Los jugadores de un determinado equipo de baloncesto


se clasifican por altura según la tabla siguiente:

Altura 1,70-1,75 1,75-1,80 1,80-1,85 1,85-190


1,90-195 1,95-2,00
Número 1 3 4 8
jugadores 5 2

Se pide calcular los cuartiles 1 y 3.

87
7.0 MEDIDAS DE DISPERSIÓN

Tratan de medir el grado de dispersión que tiene una


variable estadística respecto a una medida de posición o
tendencia central. La representatividad proviene de su
dispersión, a mayor dispersión menor representatividad de
la medida de posición y viceversa. Se entiende por
dispersión o variabilidad, a la mayor o menor separación de
los valores de la muestra, respecto de las medidas de
centralización que hayamos calculado.

Podemos concretar diciendo que las medidas de dispersión


se basan en la idea de medir las diferencias entre unos datos
y otros midiendo las diferencias de cada dato con la media,
esto es, usando las desviaciones; pero como éstas siempre
suman cero, es preciso considerar su valor absoluto o su
cuadrado para que ello no ocurra.

Para comprender el comportamiento de una serie de datos


no es suficiente determinar las medidas de tendencia
central, es importante conocer cuan alejados se encuentran
los datos respecto a su punto de concentración.

La importancia del estudio de las medidas de variación es


que pueden medir el grado de variación de una serie de
datos y cuan representativo de la distribución es el
promedio.

Las medidas de dispersión más utilizadas son:

 Recorrido.

88
 Desviación media.
 Varianza.
 Desviación estándar.
 Coeficiente de variación.

7.1 Recorrido.

En una observación cuyos datos son numéricos, el


recorrido o amplitud es la diferencia entre los valores
extremos. El valor de la diferencia depende de los
valores de los individuos que se encuentran en los
extremos.

El recorrido o amplitud (A) es la diferencia entre el


mayor valor y menor valor que se presente entre los
datos.

Ejemplo: Si se tienen los valores 22 25 28 30 31


35 36 37 44 47 48

A = 48 - 22 = 26

89
7.2 Desviación Media

La desviación media (Dm) es la media aritmética de los


valores absolutos de las desviaciones con relación a un
valor medio. Se puede calcular a partir de la media
aritmética o de la mediana.

La desviación media es útil para tratar con pequeñas


muestras que no requieren análisis muy complejos.

Para conocer con un solo indicador que tan disperso se


encuentran un conjunto de datos a un punto de
concentración, debemos como primera medida, calcular
la distancia de cada dato respecto a la media aritmética.

Por ejemplo:

5 4 2 1
1 1 3 2
3 2 1 3
2 1 3 2
4 2 1 1

Tenemos que la media aritmética es 2.2 (indicador de


tendencia central por excelencia). El primer dato (5), se
aleja de la media en 2.8 hacia la derecha.

90
Gráficamente tendríamos:
2.8

1.8

1 2 3 4 5

91
Para el segundo dato (4) la distancia es de 1,8 respecto a
la media aritmética:

Para responder a la pregunta de ¿qué tan disperso están


los datos respecto a la media aritmética?, recurriremos
nuevamente al promedio simple. Para llegar a una
fórmula básica de dispersión, en que las distancias
positivas y negativas no se eliminen, modificaremos la
fórmula anterior para trabajar solo con distancias
positivas mediante el valor absoluto:

Para una serie estadística la desviación media se calcula


con la siguiente forma:

Σ(X - ): Sumatoria de las diferencias entre el valor de


la variable y la media aritmética.

Σd : Valor absoluto de la sumatoria de las desviaciones.

92
1) Calcular la desviación media para las densidades de
los líquidos.

Densidad Desviación
1,26 0,32
1,06 0,12
1,04 0,10
1,02 0,08
0,90 -0,04
0,79 -0,15
0,73 -0,21
0,72 -0,22
7,52 1,24

0,16 es el valor con que se separan cada una de las


densidades con respecto a la media aritmética.

2) Cálculo de la desviación media para una serie


estadística de frecuencia.

Se considera en el ejemplo los datos de las mismas


densidades pero repetidos.

Densidad f X.f d f.d


X
1,26 2 2,52 0,31 0,62
1,06 1 1,06 0,11 0,11
1,04 3 3,12 0,09 0,27
1,02 6 6,12 0,07 0,42

93
0,90 1 0,90 -0,05 -0,05
0,79 3 2,37 -0,16 -0,48
0,73 2 1,46 -0,22 -0,44
0,72 2 1,44 -0,23 -0,46
Total….. 20 18,99 2,85

3) Cálculo de la desviación media para una serie


estadística de intervalos.

Ejemplo: Se registraron las siguientes velocidades


iniciales de las balas que imprimieron 33 fusiles, calcular
su desviación media.

X f Mc Mcs u f.u d f.d


851 - 900 6 875,5 3,00 18,00 118,2 709,27
801 - 850 4 825,5 2,00 8,00 68,2 272,85
751 - 800 5 775,5 1,00 5,00 18,2 91,06
701 - 750 7 725,5 725,5 0,00 0,00 -31,8 -222,52
651 - 700 6 675,5 -1,00 -6,00 -81,8 -490,73
600 - 650 5 625,0 -2,01 -10,05 -132,3 -661,44
Totales….. 33 20,98 2002,83

94
Donde:

Mc: Punto medio de clase.


Mcs: Punto medio de clase supuesto.

.I

=
7.3 Varianza

La variancia es el promedio de la sumatoria de los


cuadrados de las desviaciones. Mide la mayor o menor
dispersión de los valores de la variable respecto a la
media aritmética. Es un indicador del alejamiento de los
valores respecto de su valor medio.

El valor de la variancia depende de las desviaciones,


cuanto mayor sean las desviaciones en relación a la
media aritmética, mayor será el valor de la variancia.

En la varianza el valor de sus unidades no la podemos


usar porque se expresan al cuadrado; para hacerlo, es
preciso tomar la raíz cuadrado de los mismos, este nuevo
valor, se lo conoce como desviación estándar.

95
Donde:

N: Número total de casos.

La varianza para datos de la población se representa con


σ2 y para datos muestras con S2.

Las fórmulas deben definirse según se trate de datos


agrupados o no.

7.4 Desviación Estándar

La desviación estándar es la raíz cuadrada del promedio


de la desviación o diferencias de cada uno de los valores
con respecto a la media. Equivale a la raíz cuadrada de
la varianza.

El mayor valor o menor valor de la desviación estándar,


expresa la mayor o menor desviación de los datos
respecto a la media. Si no existe variación en los datos o
variables observadas, todas ellas serán iguales a su
media; por lo tanto, las desviaciones respecto a la media
serán iguales a cero y el valor de la desviación estándar
es cero.

96
Para el cálculo de la desviación con datos agrupados o
no se precede de la siguiente forma:

7.4.1 Desviación típica de una serie estadística.

Ejemplo: Calcular la desviación estándar en decibelios


(dB), con los datos de ruido medidos en 10 sitios
diferentes.

x x^2
67,9 4610,41
70,2 4928,04
68,8 4733,44
77,1 5944,41
62,7 3931,29
71,1 5055,21
81,9 6707,61
63,2 3994,24
82,7 6839,29
78,1 6099,61
723,7 52843,55
n=10

97
s = 6,85

7.4.2 Desviación típica de una serie estadística de


frecuencia.

Ejemplo: Determinar la desviación típica de las


lecturas de temperatura obtenida por una estación
meteorológica.

x f f.x x^2 f.x^2


27,1 5 135,5 734,41 3672,05
27,4 2 54,8 750,76 1501,52
28,9 6 173,4 835,21 5011,26
29,1 4 116,4 846,81 3387,24
29,2 3 87,6 852,64 2557,92
29,5 5 147,5 870,25 4351,25
29,8 4 119,2 888,04 3552,16
30,3 7 212,1 918,09 6426,63
Total.. 36 1046,5 6696,21 30460,03

98
S = 1,97

7.4.3 Desviación típica de una serie estadística de


intervalo.

Ejemplo: En cuarenta sitios de la ciudad se midieron


los niveles de ruido, calcular las variación de las
variables o datos observados en torno al promedio.

x f Mc Mc^2 [Link] [Link]^2


80,6 - 84,6 5 82,6 6822,8 413 34113,8
75,6 - 79,6 9 77,6 6021,8 698,4 54195,84
70,6 - 74,6 7 72,6 5270,8 508,2 36895,32
65,6 - 69,6 8 67,6 4569,8 540,8 36558,08
60,6 - 64,6 4 62,6 3918,8 250,4 15675,04
55,6 - 59,6 4 57,6 3317,8 230,4 13271,04
50,6 - 54,6 3 52,6 2766,8 157,8 8300,28
Totales…… 40 2799,0 199009,4

99
S= 8,87

EJERCICIOS

Se ha preguntado a 40 personas el número de personas


que forman sus hogares, teniendo los siguientes
resultados:

No personas en el hogar 2 3 4 5 6 7
Frecuencia 4 11 11 6 6 2

a. Calcula la media, la mediana, la moda y la


desviación típica.
b. Haz el diagrama correspondiente.

100
7.5 Coeficiente de Variación

El Coeficiente de Variación es una medida de variación


relativa, más que una medida de variación absoluta,
expresa la desviación estándar como un porcentaje de
la media.

Se define al coeficiente de variación de Pearson como


el cociente entre la desviación estándar y la media
aritmética de una distribución.

La fórmula está dada por la expresión:

Como la desviación estándar y la media se expresan en


la misma unidad de medida, ésta se anula, obteniéndose
una unidad de medición independiente o medida
adimensional.

El coeficiente de Pearson se usa cuando se trata de


comparar la dispersión entre dos poblaciones en las que
las unidades de medida (desviación estándar) son
distintas, o que aún teniendo la misma unidad de
medida difieren en sus magnitudes.

Ejemplo: Se desea comparar dos muestras sobre la


producción de dos parcelas de diferentes años que
tienen los siguientes resultados;

101
Datos Parcela 1 Parcela 2

Periodo 3 años 2 años


Producción media 620 Kg 390 Kg
Desviación estándar 5 Kg 5 Kg

La comparación de las desviaciones estándar podría


llevar a concluir que las dos muestras poseen igual
variabilidad. Sin embargo, si se calculan los
coeficientes de variación para las parcelas se tiene los
siguientes resultados:

Parcela 1:

Parcela 2:

Los resultados del coeficiente de variación expresan


que a pesar de que las muestras tienen el mismo valor
de desviación estándar tienen diferentes dispersiones de
sus datos respecto a la media.

Ejemplo: Así, por ejemplo, si tenemos el peso de 5


pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de
69,6 kg. y su desviación típica (s) = 10,44 y la TAS de
los mismos (150, 170, 135, 180 y 195 mm Hg) cuya
media es de 166 mm Hg y su desviación típica de 21,3.

102
La pregunta sería: ¿qué distribución es más dispersa, el
peso o la tensión arterial? Si comparamos las
desviaciones típicas observamos que la desviación
típica de la tensión arterial es mucho mayor; sin
embargo, no podemos comparar dos variables que
tienen escalas de medidas diferentes, por lo que
calculamos los coeficientes de variación:

CV de la variable peso =

CV de la variable TAS =

A la vista de los resultados, observamos que la variable


peso tiene mayor dispersión.

A diferencia de la desviación estándar que se expresa


con la misma unidad de los datos observados, el
coeficiente de variación se expresa en porcentaje, lo
cual, facilita comparar el nivel de dispersión de dos
muestras.

Por ejemplo, no se puede comparar el nivel de


dispersión de una serie de datos de densidad de metales
que se expresa gr/cm3, con otra serie que corresponda
a la resistencia a la compresión que se expresa en
kg/cm2. En cambio, sus coeficientes de variación son
ambos porcentajes, por lo que sí se pueden comparar.

103
Se puede concluir que el coeficiente de variación,
además, presenta los siguientes aspectos:

a. Es un valor estadístico útil para comparar la


dispersión de conjuntos de datos que tienen
distintas desviaciones estándar y distintos
promedios.

b. El coeficiente de variación pierde su utilidad


cuando la media se aproxima a cero.

EJERCICIOS

1. Los jugadores de un determinado equipo de


baloncesto se clasifican por altura según la tabla
siguiente:

1.71- 1.76- 1.81- 1.86- 1.91- 1.96-


Altura
1.75 1.80 185 1.90 1.95 2.00
#
1 3 4 8 5 6
jugadores

Se pide analizar calcular la desviación típica.

104
2. La media y la desviación típica de los puntos
conseguidos por Iliana y Rocío en una semana de
entrenamiento jugando al baloncesto han sido las
siguientes: media de Iliana 22 puntos y
desviación típica 4,106. Media de Rocío 22
puntos y desviación típica 2.
a. Calcula el coeficiente de variación de cada
una de ellas.
b. ¿Cuál de las dos ha sido más regular?

8.0 MEDIDAS DE DISTRIBUCIÓN

Las medidas de distribución permiten identificar la forma


en que se encuentran dispersos los valores de las
observaciones en una representación gráfica. La
importancia de estas medidas se fundamenta en establecer
la distribución prescindiendo del gráfico.

Las medidas de distribución ya no trata de determinar la


magnitud de la dispersión de las variables con respecto a la
media, sino, la de analizar como los datos se distribuyen en
torna a ella.

Las principales medidas de distribución son las de


Asimetría y la de Curtosis

8.1 Asimetría

105
La asimetría es la medida que permite determinar si los
datos se distribuyen de manera uniforme alrededor de su
valor medio. Esta medida cuantifica el grado de
asimetría de la distribución en torno a una medida de
tendencia central.

De acuerdo como se distribuyen los datos respecto al eje


de simetría se presentan los siguientes casos:

Simetría positiva, cuando los datos están por arriba de la


media aritmética.

Asimetría negativa cuando la agrupación de valores está


por debajo de la media.

106
Simétrica si aproximadamente los valores de la
observación se distribuyen por igual a ambos lados de la
media.

La asimetría se puede calcular por medio del


Coeficiente de asimetría o de Fisher con la siguiente
ecuación:

Donde:

g1: Coeficiente de asimetría de Fisher.


Xi: Valores de la variable
Media aritmética
f : Frecuencia de cada valor

Para los valores del coeficiente se tiene que:

107
g1 = 0 La distribución es Simétrica. Existe
aproximadamente la misma cantidad de valores a los dos
lados de la media. Este valor es difícil de conseguir por
lo que se tiende a tomar los valores que son cercanos ya
sean positivos o negativos (± 0.5).

g1 > 0 La curva es asimetría positiva por lo que los


valores se tienden a reunir más en la parte izquierda que
en la derecha de la media.

g1 < 0 La curva es asimétricamente negativa por lo que


los valores se tienden a reunir más en la parte derecha de
la media.

Desde luego entre mayor sea el número, positivo o


negativo, mayor será la distancia que separa la
aglomeración de los valores con respecto a la media.

8.2 Coeficiente de Curtosis

Es una medida de asimetría que expresa la intensidad de


concentración de los valores en la región central de la
distribución.

Según Curtosis se presentan tres tipos de distribución:

Distribución mesocúrtica: Se expresa cuando el grado de


concentración se encuentra alrededor de los valores

108
centrales de la variable. Cuando esto ocurre se tiene
entonces una distribución normal.

Curva Mesocúrtica
Distribución leptocúrtica: Es cuando las observaciones
presenta un elevado grado de concentración alrededor de
los valores centrales de la variable.

109 Curva
Leptocúrtica
Distribución platicúrtica: Es cuando existe un bajo grado
de concentración alrededor de los valores centrales de la
variable.

Curva
Platicúrtica

La fórmula que define el cálculo del Coeficiente de


Curtosis es la siguiente:

Para los diferentes valores del coeficiente se tiene:

g2 = 0 (distribución mesocúrtica).
g2 > 0 (distribución leptocúrtica).
g2 < 0 (distribución platicúrtica).

110
Ejemplo: Calcular el coeficiente de Curtosis para los
datos de resistencia óhmica obtenida de algunos de
aparatos eléctricos.

Valor f Σ(Xi-Xm)^4*ni Σ(Xi-Xm)^2*ni


2,7 1 4,5892 2,1422
2,8 4 13,8310 7,4380
2,9 4 10,1988 6,3871
3,4 2 0,6801 1,1663
4 1 0,0007 0,0268
4,5 2 0,0256 0,2263
4,7 3 0,2483 0,8631
4,8 3 0,4920 1,2149
5,2 4 4,6143 4,2962
5,3 3 5,0025 3,8740
5,5 3 9,5680 5,3576
11 30 49,2505 32,9924
Media= 4,16

El resultado de -1,5072 correspondiente al Coeficiente de


Curtosis señala que se trata de una distribución platicúrtica,
esto es, de una baja concentración de los valores centrales
de la distribución.

111
9.0 ANÁLISIS DE ASOCIACIÓN.

Es muy frecuente encontrar variables que se encuentran


relacionadas entre sí; por ejemplo, la intensidad de la
corriente eléctrica se asocia con otros factores como el
voltaje y la resistencia. En el crecimiento de una planta
están relacionados factores como el tipo del suelo, cantidad
de agua, disponibilidad de nutrientes, etc.

La asociación o forma como están vinculadas las variables


nos lleva frecuentemente a formular preguntas como: ¿la
densidad de los metales está relacionado con su
resistencia?, ¿el diámetro de un cableado tiene que ver con
la intensidad de la luz eléctrica?, ¿la demanda de un artículo
dependerá de su precio en el mercado?

El análisis de asociación de variables permite establecer la


relación entre dos o más variables que expresen un cierto
grado de dependencia o asociación entre ellas; asociación,
que puede medirse por medio de una función o modelo
matemático.

El problema principal cuando se analizan datos bivariantes


(se caracterizan porque tienen dos medidas, ejemplo: peso y
altura, diámetro y resistencia) o multivariantes (con tres
medidas, ejemplo: longitud, diámetro y resistencia) es
llegar a descubrir y medir la asociación y covariación ente
las variables, así como, determinar como las variables
varían juntas. A este procedimiento se conoce como
Estimación por Asociación.

112
La estimación por asociación es una predicción que busca
expresar la naturaleza de las relaciones de las variables, en
forma matemáticamente precisa, de modo que se pueda
predecir el valor de una variable con base en la otra. Dicha
estimación se puede lograr por medio del análisis de
regresión y del análisis de correlación.

9.1 Covariancia

Es la medida de la asociación entre las magnitudes de


dos características. Cuando la asociación de las
magnitudes es pequeña o nula la covariancia tiende a
cero.

La covariancia es positiva cuando los valores grandes de


una característica tienden a asociarse con los valores
grandes de otra. Es negativa, si los valores grandes de
una características se asociación con los valores
pequeños de otra característica.

Dos variables están variando conjuntamente y en el


mismo sentido cuando al crecer los valores de cada uno
de ellas, aumentan los valores los valores de la otra. Pero
también pueden variar en sentido contrario, esto es,
cuando crecen los valores de la una, disminuyen los de la
otra.

La variancia de la población X y Y se simboliza con σ xy;


y los de la muestra, por sxy.

113
La fórmula de la covariancia es:

Ejemplo: Calcular el grado de asociación que existe entre


el diámetro y la longitud de las probetas.

Var Valores Sumas


Y 4 6 8 9 12 8 10 12 8 6 83
X 12 10 19 12 15 20 24 18 25 15 170

Media de Y = 8,3

Media de X = 17,0

114
9.2 Correlación

Permite analizar en una distribución bidimensional la


relación que guardan entre sí dos variables. La
intensidad de esta relación puede ser determinada por un
índice numérico conocido como coeficiente de
correlación lineal.

La aplicación del coeficiente de correlación es posible


cuando la relación entre las variables es lineal, esto es, si
después de graficar los pares de valores de las variables
se observa que la nube de puntos se aproxima a una
recta.

El coeficiente de correlación de una población


bidimensional se representa por  (rho), siendo su
estimador r.

La correlación puede ser lineal o lineal. Es lineal cuando


la relación entre las dos variables puede ser representada
por una línea recta, y es no lineal cuando la correlación
está representada por una línea curva.

Además, de acuerdo a los fenómenos que relaciona a dos


variables, la correlación puede ser perfecta, imperfecta y
nula.

En la perfecta la variación de los fenómenos se


corresponden en forma igual.

En la correlación imperfecta la variación de uno de los


fenómenos se pude corresponder con la variación del

115
otro fenómeno, pero no se puede llegar al valor de una
determinación.

En la nula, no existe relación entre los fenómenos.

De acuerdo con el signo la correlación se considera


positiva o directa y negativa o inversa.

Es positiva cuando las dos variables aumentan o


disminuyen en el mismo sentido.

Es negativa cuando se comportan en sentido contrario.

9.2.1 Diagrama de Puntos o dispersión

Es un gráfico que representa un conjunto de datos y de


conclusiones deducibles de esos datos.

Los datos representan los valores de las variables X y Y


que pueden encontrarse distribuidos en el primer
cuadrante de un sistema de coordenadas; y, el diagrama
de dispersión que se establezca se obtendrá por la
ubicación de los valores de X en la abscisa y de la
variable Y en la línea vertical. La primera se toma
como la variable independiente y la Y como la variable
dependiente.

De acuerdo con los diagramas de dispersión se ilustran


los tipos de correlación.

116
117
En el diagrama de la Figura A todos los puntos tienen
una tendencia situarse sobre una línea recta ascendente
de izquierda a derecha, con lo que se define una
correlación perfecta.

En el diagrama de la Figura B, los puntos también caen


sobre una línea recta, pero descendente; siendo
también, una correlación perfecta.

La correlación puede asumir valores positivos o


negativos. La correlación es positiva cuando una de las
variables incrementa la otra se incrementa también y
viceversa (cuando ambas decrecen).

La correlación es negativa cuando una de las variables


se incrementa, la otra disminuye.

En las Figura C, D y F se presenta una relación


evidente, pero ésta no es de tipo lineal. No existe
correlación cuando graficado los puntos se muestran
como en la Figura G.

118
La fórmula del coeficiente de correlación lineal simple
es:

El coeficiente de correlación siempre debe encontrarse


en el rango de -1 a +1, lo que equivale a una
correlación perfecta.

Como el coeficiente de correlación es una expresión


numérica que expresa el grado de concomitancia que
existe entra las dos variables, es importante definir la
significación de sus valores:

0.70 ≤ r ≤ +1 Correlación alta, perfecta y positiva.


0.40 ≤ r ≤ 0.69 Correlación moderada.
0.10 ≤ r ≤ 0.39 Correlación baja.
r= -1 Correlación alta, perfecta y negativa.

A partir del coeficiente de correlación lineal se calcula


el coeficiente de determinación, el cual, permite
evaluar qué porcentaje de la variabilidad total de la
variable dependiente es atribuible a la variable
independiente.

El coeficiente de determinación (rd) equivale al valor


del coeficiente de correlación lineal elevado al
cuadrado.

119
9.3 Regresión Lineal Simple

Las variables cuantitativas en la mayoría de los casos se


encuentran relacionadas en algún grado con otras. La
dependencia, asociación o forma de relacionarse, es lo
que hace posible que una de las variables pueda
matemáticamente expresarse en función de la otra. Por
ejemplo: la resistencia a la flexión está relacionada con
la densidad del cuerpo; la resistencia al esfuerzo cortante
con el diámetro de una soldadura; la dureza de un cuerpo
está relacionada con su densidad; la intensidad del viento
se relaciona con su velocidad; el flujo de las emisiones
gaseosas con la temperatura; el monto de un salario con
el nivel educativo, etc.

En este tipo de relación se considera al valor de la


variable dependiente como Y, que depende en cierto
grado de la variable independiente X. La variable
dependiente es una variable aleatoria, pero los valores de
la variable independiente son cantidades fijas que el
analista o investigador selecciona y controla.

La relación media entre X y Y se puede describir con


una ecuación lineal, cuya representación geométrica es
una línea recta.

120
La altura de la línea señala un valor medio de Y para un
valor fijo de X.

Cuando X = 0 el valor medio de Y es igual a A.

El valor de A se llama ordenada al origen y es el punto


en que la línea recta cruza el eje Y.

La pendiente es el grado de inclinación de la recta. Si es


positiva, la recta es creciente. Si es negativa es
decreciente. Es el cociente entre el incremento que se
produce en la variable dependiente, Y, cuando se
incrementa la variable independiente, X.

La pendiente se mide por B que da la cantidad media de


cambio de Y por unidad de cambio en el valor de X. B
indica el tipo de relación entre X y Y.

La ecuación de regresión para el modelo de regresión


lineal bivariante es:

121
Donde A y B son los coeficientes de regresión
poblacional. La tarea principal del análisis de la
regresión es estimar A y B.

Se puede representar por a y b las estimaciones de A y B,


entonces la ecuación de regresión muestral se convierte
en:

y = a + bx

de donde:

El coeficiente a se puede determinar también como:

: Media aritmética de valores de x

: Media aritmética de valores de y

Ejemplo:

122
Las siguientes muestras de acero con diferentes
porcentajes de concentraciones de carbono1 fueron
sometidas a ensayo de resistencia a la tensión (lb/plg 2),
teniéndose los siguientes datos:

% Carbono 6 22 28 36 41 48 59 72 71
Tensión (miles) 85 110 132 158 201 208 215 275 284

Determine la relación de dependencia que existe entre


las variables de la composición de los aceros a
diferentes porcentajes de concentración de carbono con
la resistencia a la tensión.

Cálculos: Para simplificar las operaciones de cálculo la


tensión ha sido dividida para mil.

%Carbono Tensión
x y xy x^2

6 85 510 36
22 110 2420 484
28 132 3696 784
36 158 5688 1296
41 201 8241 1681
48 208 9984 2304
59 215 12685 3481
1
Los aceros al carbono son una mezcla de hierro y carbono, siendo el
hierro el solvente y el carbono el soluto. Los átomos de carbono se
ubican en los intersticios que existen entre los átomos de hierro.

123
72 275 19800 5184
71 284 20164 5041
383 1668 83188 20291

a = 185,44 – 3,06*42,55 = 55,26

= 42,55

= 185,44

Respuesta: En cuanto a
la relación de dependencia se tiene que por cada unidad
de incremento porcentual de carbono en el acero, su
resistencia se incrementa 3,06 veces.

Luego, la ecuación de la recta que calcula la predicción


de los valores es:

124
El ajuste de la recta de regresión y el cálculo de los
coeficientes a y b, también puede ser deducidos con el
siguiente procedimiento.

a. Construcción del diagrama de dispersión.

y
Tensión

% Carbono

b. Uso de fórmulas a desarrollar:

y = a + bx 1

125
3

c. Elaboración de la tabla de valores:

%Carbono Tensión
x y xy x^2
6 85 510 36
22 110 2420 484
28 132 3696 784
36 158 5688 1296
41 201 8241 1681
48 208 9984 2304
59 215 12685 3481
72 275 19800 5184
71 284 20164 5041
383 1668 83188 20291

Teniendo los siguientes valores:

d. Sustitución de valores en las fórmulas 2 y 3

126
1668 = 9(a) + b(383)

83 188 = a(383) + b(20 291)

e. Se resuelve el sistema de ecuaciones resultantes y se


tiene que:

b = 3.06
a = 55.26

y = 55.26 + 3.06x

Ejemplo.

Se desea conocer el esfuerzo de corte que requiere para


cortar un material con una dureza de 760 kg/cm2. Los
datos obtenidos de los ensayos fueron los siguientes:

Esf
18.8 35.9 7.6 14.8 18.9 24.5 35.7 14.9 22.0 26.8
corte
Dureza 331. 56.9 6.8 27.7 45.7 64.5 72.8 86.0 48.0 47.6

Además, dibuje el gráfico de dispersión y la recta de


regresión.

Ejemplo.

Si el punto de intersección de la recta de regresión coincide


con el punto de cruce en origen de las coordenadas, cuál

127
sería el esfuerzo de corte sabiendo que el valor de la
pendiente es de 1.02 y la dureza de 65.22.

128
9.4 La Regresión como ecuación predictiva

La ecuación de la regresión muestral se conoce como


ecuación predictiva, porque su función es predecir el
valor medio de y; o, el valor de una observación
individual de y asociado con un valor determinado de x.

La eficiencia predictiva depende de la variabilidad de los


valores individuales de y provenientes de los valores
calculados (promedios) de y asociados con los valores
de x.

Ejemplo: Si se desea predecir la resistencia de un acero


para una concentración de carbono de 20%, se tendría lo
siguiente:

yc = 55,26 + 3,06 * 20 = 116,46

Como los valores de la tensión se dividieron para mil,


ahora el resultado debe multiplicarse por mil, entonces,
la resistencia que se tiene es de 116.460 lb/plg2

129
10.0 ANÁLISIS DE VARIANZA DE LA LÍNEA DE
REGRESIÓN SIMPLE.

Es importante conocer el nivel de precisión de la línea


regresión con los datos. La línea de regresión es una media
movible que proporciona un valor medio de Y asociada con
un valor particular de X.

Los valores observados de Y pueden estar por arriba o por


debajo de la línea de regresión, de la misma forma como se
ubican respecto a la media general de Y.

El análisis de variancia se utiliza para comparar las medias


de las variables que participan en un experimento, para
probar e inferir si entre ellas existen o no verdaderas
diferencias.

Se consideran tres las etapas correlativas que hay que


observar para desarrollar el método del análisis de
variancia, las cuales son:

a. A su vez, tiene las siguientes fases:


i. Se debe identificar las fuentes o causas de
variación con sus correspondientes grados de
libertad.
ii. Se determina las sumas de cuadrados para
cada una de las fuentes de variación.
iii. Se calcula las variancias o cuadrados medios.

130
iv. Se realiza la prueba de significación,
conocida también como Prueba de F o razón
de las variancias.
b. Se elabora el cuadro del Análisis de Variancia.
c. En esta etapa se procede a la interpretación de los
resultados del análisis estadístico.

El análisis de varianza considera básicamente determinar


los siguientes valores:

 La suma de cuadrados corregidos para Y.


 La suma de cuadrados de reducción o suma de
cuadrados de la regresión. SC REDUCCIÓN.
 La suma de cuadrados residual. SC Residual.

La suma de cuadrados corregidos para Y, estima la cantidad


de variación de los valores individuales de Y respecto al
valor medio de Y. La fórmula que lo calcula es:

La suma de cuadrados de reducción determina la cantidad


de variación en Y que está asociada con la regresión sobre
X. Su fórmula:

131
La suma residual de cuadrados constituye la porción de la
variación total en Y que no está asociada con la regresión y
se deduce con la fórmula:

SC RESIDUAL =

En el ejemplo que se establece a continuación, mediante el


análisis de varianza, se busca conocer el nivel de precisión
que tienen los datos con la línea de regresión. Se aplican los
datos del ejemplo anterior.

% Carbono 6 22 28 36 41 48 59 72 71
Tensión (miles) 85 110 132 158 201 208 215 275 284

%Carbono Tensión
x y xy x^2
6 85 510 36
22 110 2420 484
28 132 3696 784
36 158 5688 1296
41 201 8241 1681
48 208 9984 2304
59 215 12685 3481
72 275 19800 5184

132
71 284 20164 5041
383 1668 83188 20291

Suma de cuadrados corregidos:

Suma de cuadrados de Reducción:

Suma de cuadrados residual:

SC RESIDUAL = = 1432.90

Cuadro del Análisis de Varianza de la Regresión

FUENTE DE
GL SC CM Fc
VARIACIÓN
SC REGRESIÓN (t-1)=1 37315,10 37315,10 182,29
SC RESIDUAL (n-2)=7 1432,90 204,70

133
TOTAL (n-1)=8 38748,00

En el análisis de varianza de la regresión se usa la variación


inexplicada para probar la cantidad de variación atribuible a
los tratamientos, para lo que se aplica la prueba de F.

Para encontrar el valor de la F tabular o Snedecor con el


que se va a comparar el valor de Fc, es necesario conocer
los grados de libertad del numerador, en este caso,
corresponde al de la SC de Regresión, m=1; y los grados de
libertad del error, que corresponde a la SC Residual, n=7.
Con estos valores se escogen dos niveles: nivel de 0.05 (o
nivel al 5%) y nivel 0.01 (o nivel al 1%); luego, con estos
datos, el valor tabulado de F tabular tiene:

La regresión se prueba para la F calculada (Fc) y su valor


de (en este caso) de 182,29 se compara con la F tabular de
Snedecor con 1/7 grados de libertad, se observa que es
bastante mayor, lo que permite concluir que la regresión se
acepta como significativa al nivel de 0.01, señalándose
entonces como altamente significativa.

Se determinamos el coeficiente de correlación (r), tenemos


que:

134
El valor obtenido está indicando que existe una alta
correlación entre los niveles o porcentajes de carbono en el
hierro con su resistencia a la tensión.

Otra forma de calcularlo.

Se procede con los datos del mismo ejemplo y se tiene:

%Carb Tensión
dx dy [Link] dx^2 dy^2
x y
6 85 -36,56 -100,33 3667,74 1336,31 10066,78
22 110 -20,56 -75,33 1548,52 422,53 5675,11
28 132 -14,56 -53,33 776,30 211,86 2844,44
36 158 -6,56 -27,33 179,19 42,98 747,11
41 201 -1,56 15,67 -24,37 2,42 245,44
48 208 5,44 22,67 123,41 29,64 513,78
59 215 16,44 29,67 487,85 270,42 880,11
72 275 29,44 89,67 2640,19 866,98 8040,11
71 284 28,44 98,67 2806,52 809,09 9735,11

135
383 1668 12205,33 3992,22 38748,00

Reemplazando:

Resultado igual que el anterior.

Finalmente, si se calcula el coeficiente de determinación


(r2) para evaluar que porcentaje de la variabilidad total de la
resistencia a la tensión se atribuye a los niveles o
porcentajes de contenido de carbono, se tiene:
Coeficiente de Determinación = r2 = 0.98^2 = 0.96

El valor del coeficiente de determinación está señalando


que un 96% de la variación de las resistencias a la tensión
se atribuye o depende de los niveles o concentración de
carbono.

Otro procedimiento para calcular el coeficiente de


determinación (r2) consiste en dividir la suma de cuadrados

136
de reducción o de regresión para la suma de cuadrados
corregidos

Ejemplo.

Un grupo de máquinas de distintas velocidades produjo los


siguientes artículos defectuosos (P), tal como se exponen
los datos en el cuadro.

Se pregunta:

a. ¿Cuántos artículos defectuosos se producirían en


una máquina que trabaja a una velocidad de 14800
RPM.

b. Determine cuál es el nivel de significación en la


producción los artículos defectuosos.

137
11.0 PROBABILIDAD

Introducción

La probabilidad se ha definido de distintas formas, en


general, cuando hablemos de probabilidad se lo hace en
referencia a la probabilidad de un suceso y se la entiende
como una medida cuantificada de la verosimilitud de
ocurrencia de un suceso frente a los demás sucesos de un
experimento.

Se la define también como el grado de incertidumbre en la


ocurrencia de los resultados de un experimento. En todo
caso la probabilidad de un suceso es una medida que se
puede cuantificar, que toma valores entre cero y uno a
diferencia del concepto de posibilidad que es una medida
cualitativa.

El estudio de los conceptos y las propiedades del azar más


el desarrollo matemático de los mismos, es lo que hace de
la probabilidad un instrumento fundamental para toda clase
de estudio que contenga incertidumbre.

El azar permite estudios rigurosos y científicos que pueden


expresarse a través de fórmulas matemáticas, condiciones
en las que probabilidad se fundamenta para determinar la
frecuencia con que puede presentarse un resultado
determinado cuando se realiza un experimento.

138
La estadística tiene por objeto el estudio y comportamiento
de fenómenos. Estos fenómenos son a su vez el resultado de
una experimentación, por lo que podemos hablar
indistintamente de fenómenos y experimentos aleatorios.

El experimento aleatorio es aquel que puede dar varios


resultados, anticipadamente no se puede predecir cual es el
que se va a producir en una experiencia concreta.

Los experimentos se pueden clasificar en deterministas y


aleatorios. Los experimentos deterministas son aquellos que
realizados de una misma forma y con las mismas
condiciones iniciales, ofrecen siempre el mismo resultado.
Como ejemplo, tenemos que un objeto de cualquier masa
partiendo de un estado inicial de reposo, y dejado caer al
vacío desde una torre, llega siempre al suelo con la misma
velocidad:

Cuando en un experimento no se puede predecir el


resultado final, hablamos de experimento aleatorio. Este es
el caso cuando lanzamos un dado y observamos su
resultado.

Mientras que los aleatorios, aun cuando las condiciones del


experimento no cambien el resultado del experimento es
impredecible antes de realizarlo. Por ejemplo, ante el hecho
de lanzar una moneda al aire no sabremos si saldrá cara o
cruz. Son también experimentos aleatorios la cotización de

139
las acciones de una empresa, sus beneficios, sus ventas, su
periodo de actividad, etc.). En general diremos que las
características de un experimento aleatorio son las
siguientes:

a) En circunstancias similares, el experimento se


puede repetir u observar de forma indefinida.

b) Aunque no se pueda predecir el resultado si se


puede conocer el conjunto de todos los posibles
resultados.

c) Cuando se repite pocas veces un experimento, los


resultados parecen mostrar un comportamiento
caótico, mientras que si se repite un número infinito
de veces comienza a obtenerse una regularidad en el
comportamiento de los resultados.

Cuando el experimento es aleatorio puede presentarse


diversos resultados, dentro de un conjunto posible de
soluciones, y esto aún realizando el experimento en las
mismas condiciones. Nunca se conoce que resultados se va
ha obtener. Por ejemplo:

- Si se lanza una moneda al aire y queremos saber


cual es la posibilidad que salga un número 1, o que
salga un número impar, o que salga un número
menor que 3.

140
- Al lanzar una moneda al aire el resultado puede ser
cara o cruz, pero anticipadamente no se conoce cual
de ellos va a salir.

No se puede aplicar las reglas de la probabilidad a


experimentos que no son aleatorios. Por ejemplo, si se
selecciona directamente en una moneda la cruz, entonces no
se puede hablar de probabilidad, sino de un resultado
impuesto por uno mismo.

La probabilidad de un evento se representa con P. Luego,


P(A) significa la probabilidad de que ocurra el evento A en
una sola observación o experimento.

Cero es el menor valor que puede tener un enunciado de


probabilidad lo que significa que el evento es imposible. El
mayor valor corresponde a 1 y significa que el evento
ocurra. De aquí que:

0 ≤ P(A) ≤ 1

En todo experimento un evento debe o no ocurrir. Por


consiguiente, la suma de la probabilidad de la ocurrencia
mas la probabilidad de la no ocurrencia siempre será igual a
1. Si se tiene que A´ representa la no ocurrencia del evento
A, se tiene:

P(A) + P(A´) = 1

141
11.1 Espacio Muestral

Una de las características del experimento aleatorio es


que se puede saber el conjunto de todos sus posibles
resultados, aunque los resultados individuales no son
predecibles con anterioridad.

Toda experiencia lleva a la obtención de un resultado,


pero no siempre éste es previsible con certeza o
precisión adecuadas.

A pesar de esta imposibilidad de predicción si podemos


plantearnos cuáles son los resultados esperables de un
experimento. A este conjunto de resultados lo llamamos
espacio muestral.

El espacio muestral puede ser finito o infinito. Es finito


si está formado por un conjunto finitos de resultados. En
los espacios infinitos se establecen los infinitos
numerables e infinitos no numerables. Los espacios
finitos y los infinitos numerables se los conoce como
espacios discretos, mientras a que los infinitos no
numerables se denominan continuos.

Se llama espacio muestral al conjunto de los posible


resultados de un experimento o situación aleatoria y se lo
representa por la letra E. El resultado de un experimento
o prueba se llama resultado, punto muestral, suceso o
evento elemental. Cada experimento aleatorio tiene

142
definido su espacio muestral, esto es, un conjunto con
todas las soluciones posibles.

Se tendrá siempre presente que un espacio muestral


siempre está asociado con un experimento. El espacio
muestral puede ser un número, el resultado de una
sucesión de caras o sellos, un vector o una función.

Es importante establecer qué se va a hacer y qué se va a


observar o contar a la hora de determinar el espacio
muestral en un experimento aleatorio

En todo espacio muestral podemos distinguir los


siguientes sucesos:

Sucesos elementales, los subconjuntos con un solo


elemento.

Suceso seguro, E, el propio espacio muestral.

Suceso imposible, φ, que no posee ningún suceso


elemental (no puede verificarse).

Teniendo en cuenta que los sucesos son subconjuntos se


suelen usar los diagramas de Venn para representarlos.

143
Si A y B son dos sucesos del espacio muestral E, éste
queda dividido en cuatro partes:

Los que están en A y no en B, los que están en B y no en


A, los que están en ambos y los que no están ni en a ni
en B.
Figura 2

En el dibujo se ha indicado el número de sucesos


elementales que les corresponden.

Llamaremos P(E) al conjunto de todos los sucesos, es


decir a partes de E.

Diremos que el suceso A implica el B, sí siempre que se


verifica A se verifica B. Se indica A B, pues todos los su
sucesos de A pertenecen a B.

Ejemplo 6. A = “sacar un dos” ; B = “sacar par”

Dos sucesos son iguales cuando contienen los mismos


sucesos elementales; se puede expresar esto diciendo que
se implican mutuamente, A ByB A.

144
Definición: Se llama suceso contrario (o
complementario) de A, y se representa por , Ac ó Ac, al
formado por los sucesos elementales de E que no están
en A.

Ac

Es decir se verifica o Ac cuando no se verifica A.

Ejemplo:

a. En un experimento se trata de determinar al azar los


primeros 10 motores con problemas de ignición en
una fábrica de automóviles.

Para este ejemplo, el espacio muestral que además es


finito y discreto, viene dado por:

E={1,2,3,4,5,6,7,8,9,10}

Adicionalmente, para este experimento se puede


determinar otros tipos de eventos como:

A ={la totalidad de motores son reparables}

145
B={los motores reparables son al menos 4}

Al conjunto de todos los posibles sucesos elementales


lo denominamos espacio muestral.

b. Si tiramos una moneda al aíre una sola vez, el espacio


muestral será cara o cruz.

Si el experimento consiste en lanzar una moneda al


aire dos veces, entonces el espacio muestral estaría
formado por (cara-cara), (cara-cruz), (cruz-cara) y
(cruz-cruz).

11.2 Suceso o Evento

A partir de los resultados elementales de un experimento


se presenta un suceso o evento, el cual, se trata de un
conjunto de resultados elementales del experimento.
Algunos autores usan los términos evento o
acontecimiento para nombrar lo que aquí llamamos
suceso.

Los resultados de cualquier prueba de un experimento


corresponden a un elemento del espacio muestral.

Se llama suceso o evento, dentro de un espacio


muestral, a cualquier subconjunto del espacio muestral.

146
Un suceso se realiza, cuando el resultado del
experimento aleatorio es uno de los sucesos posibles. Por
ejemplo, los resultados de la tirada de una moneda darán
cruz o cara, pero no ambas; esto es, que los puntos
muestrales o eventos elementales son mutuamente
excluyentes, estos dos eventos o sucesos no podrán
ocurrir simultáneamente en una sola prueba.

11.2.1 Tipos de sucesos o eventos

Antes de calcular las probabilidades de un experimento


aleatorio hay que definir los tipos de sucesos.

Suceso elemental: hace referencia a cada una de las


posibles soluciones que se pueden presentar.

Ejemplo: al lanzar una moneda al aire, los sucesos


elementales son la cara y la cruz. Al lanzar un dado, los
sucesos elementales son el 1, el 2, .., hasta el 6.

Suceso compuesto: es un subconjunto de sucesos


elementales.

Ejemplo: lanzamos un dado y queremos que salga un


número par. El suceso "numero par" es un suceso
compuesto o evento, integrado por 3 sucesos
elementales: el 2, el 4 y el 6

O, por ejemplo, jugamos a la ruleta y queremos que


salga "menor o igual que 18". Este es un suceso

147
compuesto formado por 18 sucesos elementales (todos
los números que van del 1 al 18).

11.3 Probabilidad de sucesos

Al definir los sucesos hablamos de las diferentes


relaciones que pueden guardar dos sucesos entre sí, así
como de las posibles relaciones que se pueden establecer
entre los mismos. Vamos a ver ahora cómo se refleja esto
en el cálculo de probabilidades.

11.3.1 Suceso contenido en otro.- Se dice que A está


contenido en B y lo indicaremos por A B si todos
los elementos de A pertenecen a B. Las posibles
soluciones del primer suceso también lo son del
segundo, pero este segundo suceso tiene además otras
soluciones suyas propias.

Ejemplo: lanzamos un dado y analizamos dos sucesos:

a) que salga el número 6: A={6}

b) que salga un número par: B={2,4,6}

Vemos que el suceso a) está contenido en el suceso b):

A B

Siempre que se da el suceso a) se da el suceso b), pero


no al contrario.

148
Cuando un suceso puede estar contenido en otro,
entonces, la probabilidad del primer suceso será menor
que la del suceso que lo contiene.

Tomando el mismo ejemplo, tenemos:

P(A) = 1/6 = 0,166

P(B) = 3 / 6 = 0,50

Por lo tanto, podemos ver que la probabilidad del


suceso contenido, suceso a), es menor que la
probabilidad del suceso que lo contiene, suceso b). Por
tano el suceso A está contenido en el suceso B.

11.3.2 Igualdad de sucesos.- A = B, en este caso, las


probabilidades de ambos sucesos son las mismas. Se
presenta cuando siempre que se cumple uno de ellos se
cumple obligatoriamente el otro y viceversa.

Ejemplo: lanzamos un dado al aire y analizamos dos


sucesos, A) que salga número par, y B) que salga
múltiplo de 2. Las soluciones coinciden en ambos
casos.

a. que salga número par: A = {2,4,6}


b. que salga múltiplo de 2: B = {2,4,6}

Vemos que las soluciones coinciden en ambos casos.

P(A) = 3 / 6 = 0,50

149
P(B) = 3 / 6 = 0,50

11.3.3 Unión de dos o más sucesos.- A ∪ B. Producirá


otro suceso formado por todos los elementos de los
sucesos que se unen; lo que es lo mismo, la
probabilidad de la unión de dos sucesos es igual a la
suma de las probabilidades individuales de los dos
sucesos que se unen, menos la probabilidad del suceso
intersección

Ejemplo: lanzamos un dado al aire y analizamos dos


sucesos: a) que salga número par, y b) que el resultado
sea mayor que 3. El suceso unión estaría formado por
los siguientes resultados: el 2, el 4, el 5 y el 6.

a. que salga número par:

A = {2,4,6}

b. que el resultado sea mayor que 3:

B = {4,5,6}

c. el suceso unión estaría formado por el siguiente


resultado:
C = {2,4,5,6}
Se expresa:

A ∪ B = {2,4,6} ∪ {4,5,6} = {2,4,5,6}

P(A) = 3 / 6 = 0,50

150
P(B) = 3 / 6 = 0,50

P (A ∪ B) = 2 / 6 = 0,33

Por lo tanto,

Como ejemplo, tenemos que la unión de un suceso


cualquiera con su complementario es el suceso seguro:

P (A u B) = (0,50 + 0,50) - 0,33 = 0,666

11.3.4 Intersección de sucesos.- A ∩ B. Es suceso


compuesto por los elementos comunes de dos o más
sucesos que se intersectan. La probabilidad será igual a
la probabilidad de los elementos comunes.

Ejemplo: lanzamos un dado al aire, y analizamos dos


sucesos:

a. que salga número par: A = {2,4,6}

b. que sea mayor que 4: B = {5,6}

c. la intersección de estos dos sucesos tiene un


sólo elemento: C = {6}

Puede expresarse:

A ∩ B = {2,4,6} ∩ {5,6} = {6}

151
El número 6 es el resultado común a ambos sucesos: es
mayor que 4 y es número par.

Su probabilidad será por tanto:

P(A ∩ B) = 1 / 6 = 0,166

11.3.5 Sucesos incompatibles, disjuntos o


mutuamente excluyentes.- A ∩ B = Ø. Este tipo de
sucesos no pueden ocurrir al mismo tiempo ya que no
tienen elementos comunes, por consiguiente, su
intersección es el conjunto vacio.

Los eventos son no excluyentes cuando es posible que


ocurran al mismo tiempo, sin embargo, esta definición
no indica que esos eventos siempre deban ocurrir
necesariamente en forma conjunta.

La probabilidad de la unión de dos sucesos


incompatibles será igual a la suma de las
probabilidades de cada uno de los sucesos y como su
intersección es el conjunto vacio no hay que restarle
nada.

Ejemplo: lanzamos un dado al aire y analizamos dos


sucesos: a) que salga un número menor que 3, y b) que
salga el número 6. Es evidente que ambos no se pueden
dar al mismo tiempo.

152
A ∩ B = {1,2} ∩ {6} = Ø

La probabilidad del suceso unión de estos dos sucesos


será igual a:

P(A) = 2 / 6 = 0,333

P(B) = 1 / 6 = 0,166

Por lo tanto,

P(A ∪ B) = 0,33 + 0,166 = 0,50

11.3.6 Sucesos complementarios o contrarios.- En


dos sucesos complementarios, el segundo es un
subconjunto que contiene todos los sucesos elementales
del espacio muestral que no están en el primero. Son
aquellos que si no se da uno, obligatoriamente se tiene
que dar el otro.

La probabilidad de un suceso complementario a un


suceso (A) es igual a 1 - P(A)

Ejemplo: lanzamos un dado al aire y analizamos dos


sucesos: a) que salga un número par, y b) que salga un
número impar. Vemos que si no se da el primero se
tiene que dar el segundo (y viceversa).

La probabilidad del suceso (A) es igual a:

153
P(A) = 3 / 6 = 0,50

Luego, la probabilidad del suceso (B) es igual a:

P(B) = 1 - P(A) = 1 - 0,50 = 0,50

Se puede comprobar aplicando la regla de "casos


favorables / casos posibles":

P(B) = 3 / 6 = 0,50

O también:

P(A) = {2,4,6} = 3/6

P(B)={1,3,5} = 3/6

P(E) =P(A) + P(B) = 1

Luego:

P( ) = P(E) – P(B) = 1 – 3/6 = 3/6 = 0.5 =50%

11.3.7 Unión de sucesos complementarios.- La


probabilidad de la unión de dos sucesos
complementarios es igual a 1.

Ejemplo: seguimos con el ejemplo anterior: a) que


salga un número par, y b) que salga un número impar.

154
La probabilidad del suceso unión de estos dos sucesos
será igual a:

P(A) = 3 / 6 = 0,50

P(B) = 3 / 6 = 0,50

Por lo tanto,

P(A U B) = 0,50 + 0,50 = 1

155
12.0 CÁLCULO DE PROBABILIDADES

Los cálculos de probabilidades realizados sobre un


experimento aleatorio siempre se hacen en referencia a la
probabilidad de un suceso y la entenderemos como una
medida cuantificada de ocurrencia de un suceso frente a los
demás sucesos del experimento.

El cálculo debe medir mide la mayor o menor posibilidad


de que se dé un determinado resultado.

La probabilidad de un suceso es una medida cuantificable


que toma valores entre 0 y 1 o que también pueden ser
expresados en tanto por ciento, entre 0% y 100%

Suceso imposible.- Su valore corresponde a cero. Es aquel


que no contiene ningún elemento del espacio muestral (E) y
por tanto no ocurrirá nunca y se lo representa por Ø

Por ejemplo: Si lanzamos un dado al aire la probabilidad


de que salga el número 7 es cero.

Valor del suceso seguro o universal.- Es cuando el suceso


coincide con el espacio muestral. El valor de uno
corresponde al suceso seguro.

156
Ejemplo: Al lanzar un dado al aire se tiene la probabilidad
de que salga cualquier número del 1 al 6; lo cual es igual o
100%.

El resto de sucesos tendrá probabilidades entre cero y


uno: que será tanto mayor cuanto más probable sea que
dicho suceso tenga lugar.

12.1 Medición de la probabilidad.

La Regla de Laplace permite medir la probabilidad de un


suceso A perteneciente a un espacio muestral (E) finito.
Se define como el cociente entre los resultados casos
respecto al total de resultados posible.

Regla de Laplace o Probabilidad clásica o a priori, se


atribuye a los primeros estadísticos que emplearon este
concepto y se refiere a que la probabilidad de cualquiera
de los sucesos de este tipo de experimentos es conocida
incluso antes que los mismos tengan lugar. De hecho no
es necesario realizar el experimento para conocer las
probabilidades de sus resultados.

La Regla de Laplace se define como:

157
Con la letra P representaremos el término probabilidad
para que no surjan dudas de su significado.

Siendo que:

A; B identifican sucesos
P(A) probabilidad del suceso A
E el espacio muestral (conjunto de todos los
resultados)

Ejemplo:

Calcular la probabilidad de que al lanzar un dado se


obtenga un número impar.

Solución:

El espacio muestral es E={1,2,3,4,5,6}

Lamamos A al suceso consistente en que el resultado es


impar A={1,3,5}

Como no suponemos que ninguna de las caras ofrece una


probabilidad de ocurrencia diferente a las demás,
podemos aplicar la regla de Laplace para obtener que

158
Se describen los axiomas:

Primer axioma: P(A) 0

La P de un suceso es un número mayor o igual a 0. No


puede haber sucesos cuya probabilidad de ocurrir sea del
120% ni del -4%.

Segundo axioma: P(E) = 1

La P del espacio muestral es 1, es decir del 10%; no


podrá asignarse P a sucesos no considerados en el
espacio muestral.

Tercer axioma: P(A B) = P(A) + P(B) SI A B=

La P de la unión de dos sucesos es igual a la suma de las


P respectivas si, y solo si, su intersección es el conjunto
vacío.

Ejemplos con el dado:

159
a) Probabilidad que salga el número 2: Aquí el caso es
tan sólo uno, esto es, que salga el dos, mientras que los
casos posibles son seis, puede salir cualquier número del
uno al seis.

Luego:

P(A) = 1 / 6 = 0,166 = 16.6%

b) Probabilidad que salga un número par: Los casos


favorables pueden ser el 2, 4, 6; esto es tres resultados
favorables; mientras que los casos posibles son seis.

Luego:

P(A) = 3 / 6 = 0,50 = 50%

c) Probabilidad que salga un número menor que 5:


Aquí se tendrían cuatro casos favorables, pudiendo salir
el uno, el dos, el tres o el cuatro frente a los seis casos
posibles.

Luego:

P(A) = 4 / 6 = 0,666 = 66,6%

d) Cuatro ases contiene un juego de naipes, la


probabilidad de obtener un as (A) en una sola extracción
es de:

P(A)= 4
P(B)= 52

160
Para poder aplicar la Regla de Laplace el experimento
aleatorio tiene que cumplir dos requisitos:

1) El número de resultados posibles (sucesos) tiene


que ser finito. Si hubiera infinitos resultados, al aplicar
la regla "casos favorables / casos posibles" el cociente
siempre sería cero.

2) Todos los sucesos tienen que tener la misma


probabilidad. Si al lanzar un dado, algunas caras
tuvieran mayor probabilidad de salir que otras, no
podríamos aplicar esta regla.

Si el experimento aleatorio no cumple se recurre a otro


modelo de cálculo de probabilidades que se basa en la
experiencia llamado modelo frecuentista.

Cuando son muchas las veces que se repite un


experimento aleatorio, las probabilidades de los diversos
posibles sucesos empiezan a converger hacia valores
determinados, que son sus respectivas probabilidades.

Ejemplo: si lanzo una vez una moneda al aire y sale


"cara", quiere decir que el suceso "cara" ha aparecido el
100% de las veces y el suceso "cruz" el 0%.

Si lanzo diez veces la moneda al aire, es posible que el


suceso "cara" salga 7 veces y el suceso "cruz" las 3
restantes. En este caso, la probabilidad del suceso "cara"

161
ya no sería del 100%, sino que se habría reducido al
70%.

Si repito numerosamente este experimento, lo normal es


que las probabilidades de los sucesos "cara" y "cruz" se
vayan aproximando al 50% cada una. Este 50% será la
probabilidad de estos sucesos según el modelo
frecuentista.

En este modelo ya no será necesario que el número de


soluciones sea finito, ni que todos los sucesos tengan la
misma probabilidad.

Ejemplo: si la moneda que utilizamos en el ejemplo


anterior fuera defectuosa (o estuviera trucada), es posible
que al repetir dicho experimento un número elevado de
veces, la "cara" saliera con una frecuencia, por ejemplo,
del 65% y la "cruz" del 35%. Estos valores serían las
probabilidades de estos dos sucesos según el modelo
frecuentista.

A esta definición de la probabilidad se le denomina


probabilidad a posteriori, ya que tan sólo repitiendo un
experimento un número elevado de veces podremos
saber cual es la probabilidad de cada suceso.

162
163
13.0 PERMUTACIONES, COMBINACIONES,
VARIACIONES.

Para aplicar la Regla de Laplace, el cálculo de los sucesos


favorables y de los sucesos posibles a veces no plantea
ningún problema, ya que son un número reducido y se
pueden calcular con facilidad:

Por ejemplo: Probabilidad de que al lanzar un dado salga el


número 2. Tan sólo hay un caso favorable, mientras que los
casos posibles son seis.

Probabilidad de acertar al primer intento el horóscopo de


una persona. Hay un caso favorable y 12 casos posibles.

Sin embargo, a veces calcular el número de casos


favorables y casos posibles es complejo y hay que aplicar
reglas matemáticas:

Por ejemplo: 5 matrimonios se sientan aleatoriamente a


cenar y queremos calcular la probabilidad de que al menos
los miembros de un matrimonio se sienten junto. En este
caso, determinar el número de casos favorables y de casos
posibles es complejo.

Las reglas matemáticas que nos pueden ayudar son el


cálculo de combinaciones, el cálculo de variaciones y el
cálculo de permutaciones.

164
13.1 Permutaciones

Es todo arreglo de elementos en donde nos interesa el


lugar o posición que ocupa cada uno de los elementos
que constituyen dicho arreglo.

Calcula las posibles agrupaciones que se pueden


establecer con todos los elementos de un grupo, por lo
tanto, lo que diferencia a cada subgrupo del resto es el
orden de los elementos.

Se llama permutación a cada una de las posibles


ordenaciones de los elementos de un conjunto finito
dado con todo sus elementos diferentes. La permutación
es todo de elementos donde interesa el lugar o posición
que ocupa cada uno de los elementos que forman dicho
arreglo.

Ejemplo:

Enumerar todas las permutaciones 2 a 2 de las letras a, b


y c.

Solución:

ab, ac, ba, bc, ca y cb

Dados elementos distintos, cualquier forma de


ordenarlos se denomina una permutación. Las formas de
ordenar los elementos se denominan permutación.

165
En el conjunto {1,2,3}, cada ordenación posible de sus
elementos, sin repetirlos, es una permutación. Existe un
total de 6 permutaciones para estos elementos: "1,2,3",
"1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1".

Para calcular el número de permutaciones se aplica la


siguiente fórmula:

La expresión Pm representa las permutaciones de m


elementos, tomando todos los elementos. Los subgrupos
se diferenciaran únicamente por el orden de los
elementos.

Ejemplo: P8 son las permutaciones de 8 elementos:

P8 = 8! = 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 = 40 320

Es decir, tendríamos 40 320 formas diferentes de agrupar


8 elementos

13.2 Combinaciones

Es todo arreglo de elementos en donde no nos interesa el


lugar o posición que ocupa cada uno de los elementos
que constituyen dicho arreglo.

166
Una combinación es un arreglo donde el orden no es
importante. Son los grupos que se pueden formar
tomando una cantidad n de elementos del total m;
considerando como grupo distinto aquel que tiene
diferentes elementos. No puede repetirse un elemento
dentro de un grupo.

Su símbolo es Cm, n y se lee “combinaciones de


elementos tomados de a n“ (en grupos de n elementos).
En este caso puede demostrarse que:

Ejemplo: entre 5 personas (a, b, c, d, e), ¿de cuántas


formas pueden elegirse tres de ella (por ejemplo, para
realizar tres trabajos donde es indistinto quién lo
realiza)?

Las alternativas, donde no interesa el orden de los


elementos en cada grupo, son:

(a, b, c) (a, b, d) (a, b, e) (a, c, d) (a, c, e) (a, d, e)


(b, c, d) (b, c, e) (b, d, e) (c, d, e)

y la cantidad total se calcula como:

167
El arreglo o listado se conoce como combinación.
Determina el número de subgrupos de 1, 2, 3, etc.
elementos que se pueden formar con los "n" elementos
de una nuestra. Cada subgrupo se diferencia del resto en
los elementos que lo componen, sin que influya el orden.

La notación para las combinaciones es C(m,n) y se lee


como la cantidad de combinaciones de m, de m
elementos determinados por n; y, dividido por n!.

Las combinaciones con repetición son los grupos que se


pueden formar tomando una cantidad n de elementos del
total m; considerando como grupo distinto aquel que
tiene diferentes elementos. Sí puede repetirse un
elemento dentro de un grupo y n puede ser hasta mayor
que m.

Su símbolo es C’m,n y se lee “combinaciones con


repetición de m elementos tomados de a n“.

En este caso puede demostrarse que:

Ejemplo: entre 5 personas (a, b, c, d, e), ¿de cuántas


formas pueden elegirse tres de ellos para realizar tres
trabajos, pudiendo una misma persona ocuparse de dos o
más?

168
Respuesta:

Por ejemplo, calcular las posibles combinaciones de 2


elementos que se pueden formar con los números 1, 2 y
3.

Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y


(2,3). En el cálculo de combinaciones las parejas (1,2) y
(2,1) se consideran idénticas, por lo que sólo se cuentan
una vez.

Para calcular el número de combinaciones de m cosas


tomadas n a la vez, o C(m,n), divide el número de
permutaciones P(m,n) entre el número de maneras que n
cosas pueden arreglarse lo cual es n!, para lo cual, se
aplica la siguiente fórmula:

O también, se aplica la siguiente fórmula:

El termino n! se denomina factorial de n y es la


multiplicación de todos los números que van desde n
hasta 1.

169
Por ejemplo: 4! = 4 * 3 * 2 * 1 = 24

La expresión C(m,n) representa las combinaciones de m


elementos, formando subgrupos de "n" elementos.

Ejemplo: C(10,4) son las combinaciones de 10


elementos agrupándolos en subgrupos de 4 elementos:

= 210

Es decir, podríamos formar 210 subgrupos diferentes de


4 elementos, a partir de los 10 elementos.

Ejemplo:

Debe seleccionarse 3 máquinas para que trabajen en


turnos vespertinos de un total de 12 que se encuentran en
la sala de torneado. Cuantos grupos de 3 máquinas
pueden elegirse sin reparar en el orden en que cada
grupo pudiera tener.

Continuando con el ejercicio, anterior: Si el total de


máquinas está compuesta de 7 de marca Toledo y 5 de
marca Yiler. ¿Cuál es la probabilidad de que en una

170
elección aleatoria, de las 3 máquinas que se elijan 2 sean
Toledo y 1 Yiler?

Número de máquinas con 2T y 1Y:

Número total de combinaciones posibles de máquinas =


C(12,3)

Calcular y determinar si se trata de una permutación o


una combinación:

1. C(8,3) C(11,4) C(40,1) C(16,5)


2. Seleccionar 5 cilindros de una producción de 40

3. Escoger 6 bujías de 20 dañadas.

4. Ocho trabajadores se encuentran en la sala de


afilado.

5. Escoger 5 relej variados de una caja de 15 relej de


diferentes marcas.

6. Cuatro vehículos estacionados en un garaje de


capacidad de 10 vehículos.

171
7. Un almacén tiene 12 alternadores de diferentes
orígenes. El mecánico del lugar compra tres
alternadores cada vez que visita el almacén. ¿El
mecánico cuantas combinaciones de diferentes
orígenes de alternadores puede comprar?

8. El profesor de resistencia de materiales tiene 15


varillas de una misma dimensión y de diferentes
aleaciones. ¿Cuántos grupos diferentes de 3
aleaciones puede hacer para ensayo de los
estudiantes?

13.3 Variaciones

Calcula el número de subgrupos de 1, 2, 3, etc.


elementos que se pueden establecer con los "n"
elementos de una muestra. Cada subgrupo se diferencia
del resto en los elementos que lo componen o en el orden
de dichos elementos (es lo que le diferencia de las
combinaciones).

Por ejemplo, calcular las posibles variaciones de 2


elementos que se pueden establecer con los número 1, 2
y 3.

Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1),


(2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y
(2,1) se consideran distintos.

Para calcular el número de variaciones se aplica la


siguiente fórmula:

172
La expresión m,n representa las variaciones de m
elementos, formando subgrupos de "n" elementos. En
este caso, como vimos en la lección anterior, un
subgrupo se diferenciará del resto, bien por los
elementos que lo forman, o bien por el orden de dichos
elementos.

Ejemplo: V10,4 son las variaciones de 10 elementos


agrupándolos en subgrupos de 4 elementos:

Es decir, podríamos formar 5.040 subgrupos diferentes


de 4 elementos, a partir de los 10 elementos.

13.4 Combinaciones, Variaciones y Permutaciones


con repeticiones.

Vamos a analizar ahora que ocurriría con el cálculo de


las combinaciones, de las variaciones o de las
permutaciones en el supuesto de que al formar los
subgrupos los elementos pudieran repetirse.

Por ejemplo: tenemos bolas de 6 colores diferentes y


queremos formar subgrupos en los que pudiera darse el
caso de que 2, 3, 4 o todas las bolas del subgrupo

173
tuvieran el mismo color. En este caso no podríamos
utilizar las fórmulas que vimos en la lección anterior.

a) Combinaciones con repetición:

Para calcular el número de combinaciones con repetición


se aplica la siguiente fórmula:

Ejemplo: C(10,4) son las combinaciones de 10


elementos con repetición, agrupándolos en subgrupos de
4, en los que 2, 3 o los 4 elementos podrían estar
repetidos:

Es decir, podríamos formar 120 subgrupos diferentes de


3 elementos.

b) Variaciones con repetición:

Para calcular el número de variaciones con repetición se


aplica la siguiente fórmula:

174
Ejemplo: Vr(12,3) son las variaciones de 12 elementos
con repetición, agrupándolos en subgrupos de 3
elementos:

Es decir, podríamos formar 1728 subgrupos diferentes de


3 elementos.

c) Permutaciones con repetición:

Para calcular el número de permutaciones con repetición


se aplica la siguiente fórmula:

Son permutaciones de "m" elementos, en los que uno de


ellos se repite " x1 " veces, otro " x2 " veces y así ...
hasta uno que se repite " xk " veces.

Ejemplo: Calcular las permutaciones de 10 elementos, en


los que uno de ellos se repite en 2 ocasiones y otro se
repite en 3 ocasiones:

175
Es decir, tendríamos 33600 formas diferentes de agrupar
estos 10 elementos

Ejercicio

1.- Calcular la probabilidad de acertar los 14 signos de


la quiniela:

Solución:

Se aplica la Regla de Laplace (casos favorables / casos


posibles). El caso favorable es tan sólo uno (acertar los
14 signos). Los casos posibles se calculan como
variaciones con repetición de 3 elementos (1, X y 2),
tomados de 14 en 14 (los signos que hay que rellenar).

Son variaciones y no combinaciones ya que el orden


influye: no es lo mismo (1,1,X) que (1, X, 1). Y son con
repetición, ya que cualquiera de los signos (1, X y 2) se
puede repetir hasta 14 veces.

Por lo tanto, los casos posibles son:

Y la probabilidad de acertar los 14 resultados es:

176
No demasiado elevada....pero el que la sigue la consigue.

Ejercicio

2.- Y la probabilidad de acertar 12 signos de la quiniela:

Solución:

Aplicamos nuevamente la Regla de Laplace. En este


caso los casos favorables se calculan como
combinaciones de 14 elementos tomados de 2 en 2, de
esta manera obtenemos todas las posibles alternativas de
fallar 2 resultados de 14 (lo que equivale a acertar 12
resultados). Utilizamos combinaciones y no variaciones
ya que el orden no importa (da lo mismo fallar el 3º y el
6º, que el 6º y el 3º)

Los casos posibles siguen siendo los mismos:

Por lo que la probabilidad de acertar 12 resultados es:

177
Por lo tanto, tenemos más probabilidades de acertar 12
resultados que 14 (¿será por eso por lo que pagan
menos?).

Ejercicio

3.- Calcular la probabilidad de, en una carrera de 15


caballos, acertar los 3 que quedan primeros (sin importar
cual de ellos queda primero, cual segundo y cual
tercero).

Solución:

Se aplica la Regla de Laplace. El caso favorable es tan


sólo uno: los 3 caballos que entran en primer lugar. Los
casos posibles se calculan como combinaciones de 15
elementos tomados de 3 en 3 (es decir, determinamos
todos las posibles alternativas de 3 caballos que pueden
entrar en las 3 primeras posiciones). Como el orden de
estos 3 primeros caballos no importa, utilizamos
combinaciones en lugar de variaciones.

Por lo tanto, los casos posibles son:

178
Por lo que la probabilidad de acertar los 3 caballos
ganadores es:

Algo mayor que en las quinielas.... Eso sí, se paga


menos.

Ejercicio

4.- Y si hubiera que acertar, no sólo los 3 caballos que


ganan, sino el orden de su entrada en meta.

Solución:

El caso favorable sigue siendo uno: los 3 caballos que


entran en primer lugar, colocados en su orden
correspondiente.

Los casos posibles se calculan ahora como variaciones


(ya que el orden influye) de 15 elementos tomados de 3
en 3 (calculamos todas las posibles maneras en que los
12 caballos podrían ocupar las 3 primeras posiciones.

Por lo que la probabilidad de acertar los 3 caballos


ganadores es:

179
Menor que en el ejemplo 3º. Ya no vale acertar que 3
caballos entran en primer lugar, sino que tenemos que
acertar el orden de su entrada.

180
14.0 PROBABILIDAD CONDICIONADA

Es la Probabilidad de que un evento ocurra dado que otro


evento ha ocurrido con anterioridad. Es la probabilidad de
que ocurra un suceso A, sabiendo que también sucede otro
evento B. La probabilidad condicional se escribe P(A|B), y
se lee la probabilidad de A dado B.

Asumamos que se tiene una caja con cuatro bolas


numeradas; extraemos de ella una bola e inmediatamente la
introducimos para hacer una segunda extracción. La
posibilidad de sacar la bola número 2 es la misma que en la
primera.

Pero si hacemos lo mismo sin reemplazar la bola extraída,


la probabilidad de extraer por ejemplo, la bola número 2 en
la segunda extracción, dependerá de la bola extraída en
primer lugar.

Sean A y B dos sucesos definidos en el espacio muestral E,


la probabilidad de A dado B se denota como:

P(A | B) = P (A ∩B) / P(B)

Siempre que P(B) > 0

Reglas de la Probabilidad:

a) Suma:

Si A y B son eventos excluyentes, entonces:

181
P (A U B) = P(A) + P(B) y se lee: La probabilidad de que
ocurra A ó B

De otra forma (no excluyentes):

P(A U B) = P(A) + P(B) – P(A∩B)

b) Eventos independientes:

Si A y B son eventos independientes (aquéllos en que la


ocurrencia de uno no afecta la ocurrencia del otro),
entonces:

P(A∩B) = P(A) * P(B) y se lee: La probabilidad de que


ocurra A y B al mismo tiempo.

De otra forma (eventos dependientes):

P(A∩B) = P(A) * P(B | A)

Cuando dos los sucesos A y B son independientes,


entonces:

P ( A | B ) = P(A∩B) / P(B)

Dado que A y B son independientes, entonces

P(A∩B) = P(A) * P(B)

y por lo tanto:

182
P ( A | B ) = P(A)

Las probabilidades condicionadas se calculan una vez que


se ha incorporado información adicional a la situación de
partida:

Ejemplo: se tira un dado y sabemos que la probabilidad de


que salga un 2 es 1/6 (probabilidad a priori). Si
incorporamos nueva información (por ejemplo, alguien nos
dice que el resultado ha sido un número par) entonces la
probabilidad de que el resultado sea el 2 ya no es 1/6.

Donde:

P (A | B) es la probabilidad de que se de el suceso B


condicionada a que se haya dado el suceso A.

P(A∩B) es la probabilidad del suceso simultáneo de A y


de B

P (A) es la probabilidad a priori del suceso A

En el ejemplo que hemos visto:

P(A | B) es la probabilidad de que salga el número 2


(suceso B) condicionada a que haya salido un número par
(suceso A).

P (A∩B) es la probabilidad de que salga el dos y número


par.

183
P (A) es la probabilidad a priori de que salga un número
par.

Por lo tanto:

P (A∩B) = 1/6

P (A) = 1/2

P (A | B) = (1/6) / (1/2) = 1/3

Luego, la probabilidad de que salga el número 2, si ya


sabemos que ha salido un número par, es de 1/3 (mayor que
su probabilidad a priori de 1/6).

La probabilidad condicionada es en este caso cero, frente a


una probabilidad a priori de 1/6.

EJEMPLO.

Se lanza un dado al aire ¿Cuál es la probabilidad de que


salga el número 2? Si sabemos que el resultado ha sido un
número par, ¿se ha modificado esta probabilidad?

Solución:

El espacio muestral que corresponde a este experimento es

E={1,2,3,4,5,6}

y se debe calcular la probabilidad del suceso A={2}. Si el


dado no está trucado, todos los números tienen la misma

184
probabilidad de salir, y siguiendo la definición de
probabilidad de Laplace,

Al calcular la probabilidad de A, según la definición de


Laplace, previamente se supone que todos los elementos del
espacio muestral tienen la misma probabilidad de salir, es
decir:

P(1)=P(2)=P(3)=P(4)=P(5)=P(6)

Por otro lado, si ha salido un número par, de nuevo por la


definición de probabilidad de Laplace tendríamos

185
Esta misma probabilidad se podría haber calculado
siguiendo la definición de la probabilidad condicionada, ya
que si escribimos

A ={2}

B={2,4,6}

y entonces

que por supuesto coincide con el mismo valor que


calculamos usando la definición de probabilidad de
Laplace.

186
2º ejemplo:

En un estudio mecánico se ha determinado que la


probabilidad de que un motor tenga problemas de ignición
(suceso B) sea del 0,10 (probabilidad a priori).

Además, la probabilidad de que el motor tenga problemas


de ignición admisión (suceso A) es el 0,25 y la probabilidad
de que el motor tenga a la vez problemas de admisión e
ignición (suceso intersección de A y B) es del 0,05.

Calcular la probabilidad de que el motor tenga problemas


de ignición si tiene problemas de admisión (probabilidad
condicionada P (A | B).

P (B ∩ A) = 0,05

P (A) = 0,25

P(A | B) = 0,05 / 0,25 = 0,20

Por lo tanto, la probabilidad condicionada es superior a la


probabilidad a priori. No siempre esto es así, a veces la
probabilidad condicionada es igual a la probabilidad a priori
o menor.

Por ejemplo: probabilidad de que al tirar un dado salga el


número 2, condicionada a que haya salido un número
impar.

Ejercicio
Se lanzan dos dados:

187
a. ¿Cuál es la probabilidad de obtener una suma de
puntos igual a 7?
b. Si la suma de puntos ha sido 7, ¿cuál es la
probabilidad de que en alguno de los dados haya
salido un tres?

Solución:

Sean los sucesos A="la suma de los puntos es 7" y B="en


alguno de los dados ha salido un tres".

a. Los casos posibles al lanzar dos dados son 36 y los


casos favorables al suceso A son los seis siguientes:
(1,6); (2,5); (3,4); (4,3); (5,2) y (6,1).

Por tanto, P(A)=6/36=1/6

b. En este caso, el suceso B/A es salir en algún dado 3,


si la suma ha sido 7. Observamos que esta situación
ocurre en las parejas (3,4) y (4,3).

Por tanto, P( B|A )=2/6=1/3

De tres talleres se registró la producción en porcentaje de


piezas defectuosas y buenas, los datos se recogen en el
cuadro:

TIPO TALLER TALLER TALLER TOTAL


Defectuosa 20
1 10
2 10
3 40
Buena 40 30 10 80

188
Total 60 40 20 120

Se desea conocer:

a. ¿Qué probabilidad existe que se pueda tomar de


toda la producción de los talleres una pieza
defectuosa?

b. Calcular la probabilidad de que una pieza tomada


sea del Taller 2 y que sea buena.

Respuesta:
a. 0

b.

189
15.0 PROBABILIDAD COMPUESTA

Es la probabilidad de ocurrencia simultánea de dos o más


eventos independientes es el producto de las probabilidades
de cada evento independiente.

La probabilidad compuesta o regla de multiplicación de


probabilidades se deriva de la probabilidad condicionada:

La probabilidad de que se den simultáneamente dos sucesos


(suceso intersección de A y B) es igual a la probabilidad a
priori del suceso A multiplicada por la probabilidad del
suceso B condicionada al cumplimiento del suceso A.

La fórmula para calcular esta probabilidad compuesta es:

Ejemplo 1º. Estudiamos el suceso A (porcentaje de varones


mayores de 40 años casados) y el suceso B (varones
mayores de 40 años con más de 2 hijos) y obtenemos la
siguiente información:

Un 35% de los varones mayores de 40 años están casados.

De los varones mayores de 40 años y casados, un 30%


tienen más de 2 hijos (suceso B condicionado al suceso A).

190
Calcular la probabilidad de que un varón mayor de 40 años
esté casado y tenga más de 2 hijos (suceso intersección de A
y B).

Por lo tanto:

P (A) = 0,35

P (B|A) = 0,30

P (A B) = 0,35 * 0,30 = 0,105

Es decir, un 10,5% de los varones mayores de 40 años están


casados y tienen más de 2 hijos.

2º ejemplo: Estudiamos el suceso A (alumnos que hablan


inglés) y el suceso B (alumnos que hablan alemán) y
obtenemos la siguiente información:

Un 50% de los alumnos hablan inglés.

De los alumnos que hablan inglés, un 20% hablan también


alemán (suceso B condicionado al suceso A).

Calcular la probabilidad de que un alumno hable inglés y


alemán (suceso intersección de A y B).

Por lo tanto:

P (A) = 0,50

191
P (B|A) = 0,20

P (A B) = 0,50 * 0,20 = 0,10

Es decir, un 10% de los alumnos hablan inglés y alemán.

192
16.0 TEOREMA DE LA PROBABILIDAD TOTAL

El Teorema de la probabilidad total nos permite calcular la


probabilidad de un suceso a partir de probabilidades
condicionadas:

Ejemplo: supongamos que si llueve la probabilidad de que


ocurra un accidentes es x% y si hace buen tiempo dicha
probabilidad es y%. Este teorema nos permite deducir cuál
es la probabilidad de que ocurra un accidente si conocemos
la probabilidad de que llueva y la probabilidad de que haga
buen tiempo.

La fórmula para calcular esta probabilidad es:

(Donde i toma valores entre 1 y n)

Es decir, la probabilidad de que ocurra el suceso B (en


nuestro ejemplo, que ocurra un accidente) es igual a la
suma de multiplicar cada una de las probabilidades
condicionadas de este suceso con los diferentes sucesos A
(probabilidad de un accidente cuando llueve y cuando hace
buen tiempo) por la probabilidad de cada suceso A.

Para que este teorema se pueda aplicar hace falta cumplir


un requisito:

193
Los sucesos A tienen que formar un sistema completo, es
decir, que contemplen todas las posibilidades (la suma de
sus probabilidades debe ser el 100%).

Ejemplo: al tirar una moneda, el suceso "salir cara" y el


suceso "salir cruz" forman un sistema completo, no hay más
alternativas: la suma de sus probabilidades es el 100%

Ejemplo: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no


forman un sistema completo, ya que no contempla todas las
opciones (podría salir el 5 o el 6). En este caso no se podría
aplicar el teorema de la probabilidad total.

Ejercicio 2º: Van a cambiar a tu jefe y se barajan diversos


candidatos:

a) Carlos, con una probabilidad del 60%

b) Juan, con una probabilidad del 30%

c) Luis, con una probabilidad del 10%

En función de quien sea tu próximo jefe, la probabilidad de


que te suban el sueldo es la siguiente:

a) Si sale Carlos: la probabilidad de que te suban el sueldo


es del 5%.

b) Si sale Juan: la probabilidad de que te suban el sueldo es


del 20%.

194
c) Si sale Luis: la probabilidad de que te suban el sueldo es
del 60%.

En definitiva, ¿cual es la probabilidad de que te suban el


sueldo?:

1.- Los tres candidatos forman un sistema completo

2.- Aplicamos la fórmula:

P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15

Por tanto, la probabilidad de que te suban el sueldo es del


15%.

195
17.0 TEOREMA DE BAYES

El Teorema de Bayes viene a seguir el proceso inverso al


que hemos visto en el Teorema de la probabilidad total.

Teorema de la probabilidad total: a partir de las


probabilidades del suceso A (probabilidad de que llueva o
de que haga buen tiempo) deducimos la probabilidad del
suceso B (que ocurra un accidente).

Teorema de Bayes: a partir de que ha ocurrido el suceso B


(ha ocurrido un accidente) deducimos las probabilidades del
suceso A (¿estaba lloviendo o hacía buen tiempo?).

La fórmula del Teorema de Bayes es:

Tratareremos de explicar esta fórmula con un ejemplo. De


todos modos, antes de entrar en el ejercicio, recordar que
este teorema también exige que el suceso A forme un
sistema completo.

Ejercicio 1º: El parte meteorológico ha anunciado tres


posibilidades para el fin de semana:

a) Que llueva: probabilidad del 50%.

196
b) Que nieve: probabilidad del 30%

c) Que haya niebla: probabilidad del 20%.

Según estos posibles estados meteorológicos, la posibilidad


de que ocurra un accidente es la siguiente:

a) Si llueve: probabilidad de accidente del 20%. ……….


(inicialmente 10%)

b) Si nieva: probabilidad de accidente del 10% ……...


(inicialmente 20%)

c) Si hay niebla: probabilidad de accidente del 5%. ……


(inicialmente 5%)

Resulta que efectivamente ocurre un accidente y como no


estábamos en la ciudad no sabemos que tiempo hizo (nevó,
llovió o hubo niebla). El teorema de Bayes nos permite
calcular estas probabilidades.

Las probabilidades que manejamos antes de conocer que ha


ocurrido un accidente se denominan probabilidades a priori
(lluvia con el 50%, nieve con el 30% y niebla con el 20%).

Una vez que incorporamos la información de que ha


ocurrido un accidente, las probabilidades del suceso A
cambian: son probabilidades condicionadas P (A|B), que se
denominan probabilidades a posteriori.

Vamos a aplicar la fórmula:

197
a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el


día del accidente (probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%.

198
18.0 INDEPENDENCIA DE SUCESOS

Dos sucesos son independientes entre sí, si la ocurrencia de


uno de ellos no afecta para nada a la ocurrencia del otro:

Ejemplo: el suceso estatura de los alumnos de una clase y el


color del pelo son independientes: el que un alumno sea
más o menos alto no va a influir en el color de su cabello, ni
viceversa.

Para que dos sucesos sean independientes tienen que


verificar al menos una de las siguientes condiciones:

P (B|A) = P (B) es decir, que la probabilidad de que se de el


suceso B, condicionada a que previamente se haya dado el
suceso A, es exactamente igual a la probabilidad de B.

Ejemplo: la probabilidad de que al tirar una moneda salga


cara (suceso B), condicionada a que haga buen tiempo
(suceso A), es igual a la propia probabilidad del suceso B.

P (A|B) = P (A) es decir, que la probabilidad de que se de el


suceso A, condicionada a que previamente se haya dado el
suceso B, es exactamente igual a la probabilidad de A.

Ejemplo: la probabilidad de que haga buen tiempo (suceso


A), condicionada a que al tirar una moneda salga cara
(suceso B), es igual a la propia probabilidad del suceso A.

199
P (A ∩ B) = P (A) * P (B) es decir, que la probabilidad de
que se de el suceso conjunto A y B es exactamente igual a
la probabilidad del suceso A multiplicada por la
probabilidad del suceso B.

Ejemplo: la probabilidad de que haga buen tiempo (suceso


A) y salga cara al tirar una moneda (suceso B), es igual a la
probabilidad del suceso A multiplicada por la probabilidad
del suceso B

Si el suceso A es independiente del suceso B, entonces el


suceso B también es independiente del suceso A.

Ejemplo 1º: analicemos dos sucesos:

Suceso A: la probabilidad de que haga buen tiempo es del


0,4

Suceso B: la probabilidad de tener un accidente es del 0,1

Suceso intersección: la probabilidad de que haga buen


tiempo y tener un accidente es del 0,08

Veamos si se cumple alguna de las condiciones señaladas:

P (B|A) = P (A ∩ B) / P (A) = 0,08 / 0,4 = 0,2 (que no es


igual a P (B))

P (A|B) = P (A ∩ B) / P (B) = 0,08 / 0,6 = 0,133 (que no es


igual a P (A))

200
P (A ∩ B) = 0,08 (que no es igual a P (A) multiplicado por
P (B))

Por lo tanto, no se cumple ninguna de las tres condiciones


señaladas por lo que estos dos sucesos no son
independientes, sino que existe algún grado de dependencia
entre ellos.

Ejemplo 2º: analicemos dos sucesos:

Suceso A: la probabilidad de que haga buen tiempo es del


0,4

Suceso B: la probabilidad de salir cara al lanzar una


moneda es del 0,5

Suceso intersección: la probabilidad de que haga buen


tiempo y que salga cara es 0,2

Veamos si se cumple alguna de las condiciones señaladas:

P (B|A) = P (A ∩ B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P


(B))

P (A|B) = P (A ∩ B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P


(A))

P (A ∩ B) = 0,2 (igual a P (A) multiplicado por P (B))

Por lo tanto, estos dos sucesos sí son independientes.

201
19.0 DISTRIBUCIONES DE PROBABILIDAD
Las distribuciones de probabilidad presentan una serie de
valores que pueden representarse como un resultado en la
ejecución de los experimentos.
Las variables aleatorias son las que generan toda
distribución de probabilidad. Se conoce como aleatoria
porque el valor tomado es completamente al azar.
Las variables aleatorias pueden ser:
Variable aleatoria discreta.
Variable aleatoria contínua.
Variable aleatoria discreta. Tomar únicamente valores
enteros y un número finito de ellos.

Variable aleatoria continua (x). Porque puede tomar tanto


valores enteros como fraccionarios y un número infinito de
ellos dentro de un mismo intervalo.

19.1 Distribuciones discretas y continuas

Las distribuciones discretas son aquellas en las que la


variable puede tomar un número determinado de valores:

Ejemplo: si se lanza una moneda al aire puede salir cara


o cruz; si se tira un dado puede salir un número de 1 al 6;
en una ruleta el número puede tomar un valor del 1 al 32.

202
Las distribuciones continuas son aquellas que presentan
un número infinito de posibles soluciones:

Ejemplo: El peso medio de los alumnos de una clase


puede tomar infinitos valores dentro de cierto intervalo
(42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza
media de vida de una población (72,5 años, 7,513 años,
72, 51234 años).

A continuación estudiaremos exclusivamente las


principales distribuciones discretas.

19.1.1. Distribuciones discretas: Bernoulli

Consiste en realizar un experimento aleatorio una sóla


vez y observar si cierto suceso ocurre o no, siendo p la
probabilidad de que sea así, éxito; y q=1-p el que no lo
sea, fracaso. Como se puede observar se trata más que
de una variable dicotómica, es decir que únicamente
puede tomar dos modalidades, es por ello que el hecho
de llamar éxito o fracaso a los posibles resultados de
las pruebas obedece más una tradición literaria o
histórica, en el estudio de las variables aleatorias que a
la situación real que pueda derivarse del resultado.

La distribución de Bernoulli es una distribución de


probabilidad discreta, que toma valor 1 para la
probabilidad de éxito p y valor 0 para la probabilidad
de fracaso q = 1 − p. La función probabilística de una
variable de Bernoulli es:

203
xi f(xi)

1 P

0 q

Luego:

0 q = 1 – p = P(x =0)
X=
1 p = P(x = 1)

Por lo tanto, si X es una variable aleatoria con esta


distribución tenemos:

Pr (X=1) = 1 – P(X=0) = p

Es el modelo que sigue un experimento que se realiza


una sola vez y que puede tener dos soluciones: acierto
o fracaso:

Cuando es acierto la variable toma el valor 1

Cuando es fracaso la variable toma el valor 0

Ejemplo: Probabilidad de salir cara al lanzar una


moneda al aire (sale cara o no sale); probabilidad de ser

204
admitido en una universidad (o te admiten o no te
admiten); probabilidad de acertar una quiniela (o
aciertas o no aciertas)

Al haber únicamente dos soluciones se trata de sucesos


complementarios:

A la probabilidad de éxito se le denomina p

A la probabilidad de fracaso se le denomina q

Verificándose que:

p+q=1

Veamos los ejemplos anteriores:

Ejemplo 1: Probabilidad de salir cara al lanzar una


moneda al aire:

Probabilidad de que salga cara: p = 0,5

Probabilidad de que no salga cara: q = 0,5

p + q = 0,5 + 0,5 = 1

Ejemplo 2: Probabilidad de ser admitido en la


universidad:

Probabilidad de ser admitido: p = 0,25

Probabilidad de no ser admitido: q = 0,75

205
p + q = 0,25 + 0,75 = 1

Ejemplo. ¿Cuál es la probabilidad de los artículos


defectuosos de una máquina que produce el 92 por
ciento de artículos aceptables?

A={artículos aceptables}

B={artículos defectuosos}

P(A) + P(B) = 1

P(B) = 1 – P(A)

P(B) = 1 – 0.92 = 0.8

19.1.2 Distribuciones discretas: Binomial

Por sus aplicaciones la distribución Binomial es quizás


la más importante, y su análisis es un caso particular de
probabilidad de variable aleatoria discreta.
Esta distribución Binomial que corresponde a la
realización de un experimento aleatorio cumple con las
siguientes condiciones:
En el experimento sólo son posible dos resultados: un
suceso llamado éxito (A), o su contrario (B), llamado
fracaso.
Al repetir el experimento, el resultado obtenido es
independiente de los resultados obtenidos
anteriormente.

206
La probabilidad del suceso (A) es constante, es decir,
no varía de una prueba del experimento a otra. Si
llamamos p a la probabilidad de A, p(A) = P, entonces
p(B) = 1 – p = q

La distribución Binomial parte de la distribución de


Bernoulli.

La distribución binomial se aplica cuando se realizan


un número n de veces el experimento de Bernoulli,
siendo cada ensayo independiente del anterior. La
variable puede tomar valores entre:

0: si todos los experimentos han sido fracaso

n: si todos los experimentos han sido éxitos

Ejemplo: se tira una moneda 10 veces: ¿cuantas caras


salen? Si no ha salido ninguna la variable toma el valor
0; si han salido dos caras la variable toma el valor 2; si
todas han sido cara la variable toma el valor 10

La distribución de probabilidad de este tipo de


distribución sigue el siguiente modelo:

Alguien entiende esta fórmula? Vamos a tratar de


explicarla con un ejemplo:

207
Ejemplo 1: ¿Cuál es la probabilidad de obtener 6 caras
al lanzar una moneda 10 veces?

k es el número de aciertos. En este ejemplo k igual a 6


(en cada acierto decíamos que la variable toma el valor
1: como son 6 aciertos, entonces k = 6)

n es el número de ensayos. En nuestro ejemplo son 10

p es la probabilidad de éxito, es decir, que salga "cara"


al lanzar la moneda. Por lo tanto p = 0,5

La fórmula quedaría:

Luego,

P (x = 6) = 0,205

Es decir, se tiene una probabilidad del 20,5% de


obtener 6 caras al lanzar 10 veces una moneda.

Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro


veces el número 3 al lanzar un dado ocho veces?

k (número de aciertos) toma el valor 4

n toma el valor 8

208
p (probabilidad de que salga un 3 al tirar el dado) es 1 /
6 (= 0,1666)

La fórmula queda:

Luego,

P (x = 4) = 0,026

Es decir, se tiene una probabilidad del 2,6% de obtener


cuatro veces el números 3 al tirar un dado 8 veces.

Ejemplos:

En una reunión de muchas personas, el 20% de los


presentes no habla español. En un grupo de 5 personas
tomada al azar:

a) ¿Cuál es la probabilidad de que ninguno hable


español?
b) ¿Cuál es la probabilidad de que 4 hablen español.

Experimento aleatorio: repetir 5 veces la prueba de


sacar al azar una persona.
Variable aleatoria de las 5 pruebas: número de “éxitos”
(o sea de personas que no hablen español) en las 5
pruebas.

209
Distribución binomial: X ~ B(5;0,20) es decir n = 5,

p = 0,20 y q = 1- p = 0,80.

a) Suceso=”ninguno habla español” ={X=5}

b) Suceso=”cuatro no hablan español”

19.1.3 Distribuciones discretas: Poisson

Este tipo de distribución es un caso particular de


probabilidad de variable aleatoria discreta. Esta
distribución debe su nombre al francés Siméon Denis
Poisson (1781-1840) y se emplea en la descripción de
muchos procesos.
Los éxitos buscados en este tipo de experimentos son
expresados por unidad de área, tiempo, pieza, etc.

210
El modelo de Poisson abarca una gran clase de eventos
y cada evento, por ejemplo, puede ser el número de
ocurrencias de accidentes, errores, desastres u otros
factores que aparecen aleatoria e independientemente
en un tiempo continuo. Entre otros se cuentan las
siguientes:

 Cantidad de aviones que aterrizan en un


aeropuerto por día, hora, minuto, etc.
 Emisión de partículas radioactivas.
 Volumen de contaminantes en el aire.
 Número de defectos de una tela por m2
 Cantidad de bacterias por cm2 de cultivo
 Llamadas telefónicas a un conmutador por hora,
minuto, etc.
 Número de embarcaciones llegadas a un puerto
por día, mes, etc.

Cuando en una distribución binomial se realiza el


experimento un número n muy elevada de veces y la
probabilidad de éxito p en cada ensayo es reducida,
entonces se aplica el modelo de distribución de
Poisson:

Se tiene que cumplir que:

p < 0,10

p * n < 10

La distribución de Poisson sigue el siguiente modelo:

211
Vamos a explicarla:

El número e es 2,71828

 = n * p (es decir, el número de veces n que se realiza


el experimento multiplicado por la probabilidad p de
éxito en cada ensayo)

k es el número de éxito cuya probabilidad se está


calculando.

Hay que hacer notar que en esta distribución el número


de éxitos que ocurren por unidad de tiempo, área o
producto es totalmente al azar y que cada intervalo de
tiempo es independiente de otro intervalo dado, así
como cada área es independiente de otra área dada y
cada producto es independiente de otro producto dado.

Veamos un ejemplo:

La probabilidad de tener un accidente de tráfico es de


0,02 cada vez que se viaja, si se realizan 300 viajes,
¿cual es la probabilidad de tener 3 accidentes?

Como la probabilidad p es menor que 0,1, y el


producto n * p es menor que 10, entonces aplicamos
el modelo de distribución de Poisson.

212
Luego,

P (x = 3) = 0,0892

Por lo tanto, la probabilidad de tener 3 accidentes de


tráfico en 300 viajes es del 8,9%

Otro ejemplo:

La probabilidad de que un niño nazca pelirrojo es de


0,012. ¿Cuál es la probabilidad de que entre 800 recién
nacidos haya 5 pelirrojos?

Luego,

P (x = 5) = 4,602

Por lo tanto, la probabilidad de que haya 5 pelirrojos


entre 800 recien nacidos es del 4,6%.

Ejemplo:
Si un banco recibe en promedio (λ =) 6 cheques sin
fondo por día, ¿cuáles son las probabilidades de que
reciba:

213
a) cuatro cheques sin fondo en un día dado (x=k),
b) 10 cheques sin fondos en cualquiera de dos días
consecutivos.
(e= 2.718281828)
Resolviendo para a:
a) k = 4; λ = 6 cheques sin fondo por día y sustituyendo en
la fórmula

P(4 cheques sin fondo) = 0.01265 = 1.26%

Resolviendo para b:

b) k=10; = 6 x 2 = 12 cheques sin fondo en promedio que


llegan al banco en dos días consecutivos.

214
P(10 cheques sin fondo)= 0.10483=10.48%

19.1.4 Distribuciones discretas: Hipergeométrica

La distribución hipergeométrica es el modelo que se


aplica en experimentos que correspondan a una
población finita sin remplazo.

En una urna hay bolas de dos colores (blancas y


negras), ¿cuál es la probabilidad de que al sacar 2 bolas
las dos sean blancas?

Son experimentos donde, al igual que en la distribución


binomial, en cada ensayo hay tan sólo dos posibles
resultados: o sale blanca o no sale. Pero se diferencia
de la distribución binomial en que los distintos ensayos
son dependientes entre sí.

Se puede concluir que los experimentos que tienen este


tipo de distribución tienen las siguientes características:
a. Al realizar un experimento con este tipo de
distribución, se esperan dos tipos de resultados.
b. Las probabilidades asociadas a cada uno de los
resultados no son constantes.

215
c. Cada ensayo o repetición del experimento no es
independiente de los demás.
d. El número de repeticiones del experimento (n)
es constante.

Si en una urna con 5 bolas blancas y 3 negras en un


primer ensayo saco una bola blanca, en el segundo
ensayo hay una bola blanca menos por lo que las
probabilidades son diferentes (hay dependencia entre
los distintos ensayos).

La distribución hipergeométrica sigue el siguiente


modelo:

Donde:

216
Vamos a tratar de explicarlo:

N: es el número total de bolas en la urna

N1: es el número total de bolas blancas

N2: es el número total de bolas negras

k: es el número de bolas blancas cuya probabilidad se


está calculando

n: es el número de ensayos que se realiza

Veamos un ejemplo: en una urna hay 7 bolas blancas y


5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de
que 3 sean blancas?

Entonces:

N = 12; N1 = 7; N2 = 5; k = 3; n = 4

Si aplicamos el modelo:

Por lo tanto, P (x = 3) = 0,3535. Es decir, la


probabilidad de sacar 3 bolas blancas es del 35,3%.

217
Pero este modelo no sólo se utiliza con experimentos
con bolas, sino que también se aplica con experimentos
similares:

Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6


solteras. Se eligen 3 personas al azar ¿Cuál es la
probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la


probabilidad de que las 3 personas sean solteras es tan
sólo del 1,75%.

218
19.1.5 Distribuciones discretas: Multinomial

La distribución multinomial es similar a la distribución


binomial, con la diferencia de que en lugar de dos
posibles resultados en cada ensayo, puede haber
múltiples resultados:

Ejemplo: a unas elecciones se presentaron 2 partidos


políticos: el POPO obtuvo un 70% de los votos y el
JEJE el 30% restante. ¿Cuál es la probabilidad de que
al elegir 5 ciudadanos al azar, 4 de ellos hayan votado
al JEJE?

Ejemplo: a esas elecciones se presentaron 4 partidos


políticos: el POPO obtuvo un 40% de los votos, el
JEJE el 30%, el MUMU el 20% y el LALA el 10%
restante. ¿Cuál es la probabilidad de que al elegir 5
ciudadanos al azar, 3 hayan votado al POPO, 1 al
MUMU y 1 al LALA?

La distribución multinomial sigue el siguiente modelo:

Donde:

X1 = x1: indica que el suceso X1 aparezca x1 veces (en


el ejemplo, que el partido POPO lo hayan votado 3
personas)

219
n: indica el número de veces que se ha repetido el
suceso (en el ejemplo, 5 veces)

n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1)

p1: es la probabilidad del suceso X1 (en el ejemplo, el


40%)

Veamos el ejemplo:

Luego:

P = 0,0256

Es decir, que la probabilidad de que las 5 personas


elegidas hayan votado de esta manera es tan sólo del
2,56%

Nota: 0! es igual a 1, y cualquier número elevado a 0 es


también igual a 1

Veamos otro ejemplo:

En una fiesta, el 20% de los asistentes son españoles, el


30% franceses, el 40% italiano y el 10% portugueses.
En un pequeño grupo se han reunido 4 invitados: ¿cual
es la probabilidad de que 2 sean españoles y 2
italianos?

220
Aplicamos el modelo:

Luego

P = 0,0384

Por lo tanto, la probabilidad de que el grupo esté


formado por personas de estos países es tan sólo del
3,84%.

19.1.6 Distribuciones discretas:


Multihipergeométrica

La distribución multihipergeométrica es similar a la


distribución hipergeométrica, con la diferencia de que
en la urna, en lugar de haber únicamente bolas de dos
colores, hay bolas de diferentes colores.

Ejemplo: en una urna hay 7 bolas blancas, 3 verdes y 4


amarillas: ¿cuál es la probabilidad de que al extraer 3
bolas sea cada una de un color distinto?

La distribución multihipergeométrica sigue el siguiente


modelo:

221
Donde:

X1 = x1: indica que el suceso X1 aparezca x1 veces (en


el ejemplo, que una de las bolas sea blanca)

N1: indica el número de bolas blancas que hay en la


urna (en el ejemplo, 7 bolas)

N: es el número total de bolas en la urna (en el


ejemplo, 14 bolas)

n: es el número total de bolas que se extraen (en el


ejemplo, 3 bolas)

Veamos el ejemplo:

Luego:

P = 0,2307

222
Es decir, que la probabilidad de sacar una bola de cada
color es del 23,07%.

Veamos otro ejemplo:

En una caja de lápices hay 10 de color amarillo, 3 de


color azul y 4 de color rojo. Se extraen 7 lápices, ¿cual
es la probabilidad de que 5 sean amarillos y 2 rojos?

Aplicamos el modelo:

Luego

P = 0,0777

Por lo tanto, la probabilidad de que los 5 lápices sean


de los colores indicados es del 7,77%.

223
19.1.7 Distribuciones continuas: Uniforme

En estadística la distribución uniforme es una


distribución de probabilidad cuyos valores tienen la
misma probabilidad.

La distribución uniforme es aquella que puede tomar


cualquier valor dentro de un intervalo, todos ellos con
la misma probabilidad.

Es una distribución continua porque puede tomar


cualquier valor y no únicamente un número
determinado (como ocurre en las distribuciones
discretas).

Se dice que una variable aleatoria X continua tiene una


distribución uniforme en el intervalo [a,b] si la función
de densidad de probabilidad (FDP) es

f(x) =

Ejemplo: el precio medio del litro de gasolina super


durante el próximo año se estima que puede oscilar
entre 196 ctvs. y 205 ctvs. americanos. Podría ser, por
tanto, de 197, 198, 200 ctvs., etc. Hay infinitas
posibilidades, todas ellas con la misma probabilidad.

224
Su función de densidad, aquella que nos permite
conocer la probabilidad que tiene cada punto del
intervalo, viene definida por:

Donde:

b: es el extremo superior (en el ejemplo, 205 ctvs..)

a: es el extremo inferior (en el ejemplo, 196 ctvs.)

Por lo tanto, la función de distribución del ejemplo


sería:

Es decir, que el valor final esté entre 196 ctvs. y 197


ctvs. tiene un 11% de probabilidad, que esté entre 200
ctvs. Y 2001 ctvs., otro 5%, etc.

El valor medio de esta distribución se calcula:

En el ejemplo:

225
Por lo tanto, el precio medio esperado de la gasolina
para el próximo año es de 200.5 ctvs.

Veamos otro ejemplo:

El volumen de precipitaciones estimado para el


próximo año en la ciudad de Sevilla va a oscilar entre
400 y 500 litros por metro cuadrado. Calcular la
función de distribución y la precipitación media
esperada:

Es decir, que el volumen de precipitaciones esté entre


400 y 401 litros tiene un 1% de probabilidades; que
esté entre 401 y 402 litros, otro 1%, etc.

El valor medio esperado es:

Es decir, la precipitación media estimada en Sevilla


para el próximo año es de 450 litros.

226
19.1.8 Distribuciones continuas: Normal

La distribución normal se presenta como un caso


particular de probabilidad de variable aleatoria
continua. Fue el francés Abraham de Moivre (1667-
1754) quién la estableció y posteriormente, Carl
Friedrich Gauss (1777-1855) elaboró estudios más
profundos y formuló la ecuación de la curva; de ahí que
también se le conozca, más comúnmente, como la
campana de Gauss.
La distribución de una variable normal está
completamente determinada por dos parámetros, su
media (µ) y su desviación estándar (σ). Con esta
notación, la densidad de la normal viene dada por la
ecuación:

Esta fórmula determina la curva en forma de campana,


conocida como campana de Gaus. En general, la función
de densidad de cualquier v.a. normal tiene una gráfica
similar, siempre simétrica respecto de la media.

227
Es el modelo de distribución más utilizado en la
práctica, ya que multitud de fenómenos se comportan
según una distribución normal.

Esta distribución de caracteriza porque los valores se


distribuyen formando una campana de Gauss, en torno
a un valor central que coincide con el valor medio de la
distribución.

Un 50% de los valores están a la derecha de este valor


central y otro 50% a la izquierda

Propiedad

No importa cuáles sean los valores de µ y σ para una


distribución de probabilidad normal, el área total bajo
la curva siempre es 1, de manera que podemos pensar
en áreas bajo la curva como si fueran probabilidades.
Matemáticamente es verdad que:

228
Aproximadamente el 68% de todos los valores de una
población normalmente distribuida se encuentra dentro
de ± 1 desviación estándar de la media.

Aproximadamente el 95.5% de todos los valores de una


población normalmente distribuida se encuentra dentro
de ± 2 desviaciones estándar de la media.

229
Aproximadamente el 99.7% de todos los valores de una
población normalmente distribuida se encuentra dentro
de ± 3 desviaciones estándar de la media.

La distribución Normal viene definida por dos


parámetros:

X: N (µ, σ2)

µ: es el valor medio de la distribución y es


precisamente donde se sitúa el centro de la curva (de la
campana de Gauss).

σ2: es la varianza. Indica si los valores están más o


menos alejados del valor central: si la varianza es baja
los valores están próximos a la media; si es alta,
entonces los valores están muy dispersos.

230
Cuando la media de la distribución es 0 y la varianza es
1se denomina normal tipificada, y su ventaja reside en
que hay tablas donde se recoge la probabilidad
acumulada para cada punto de la curva de esta
distribución. Además, toda distribución normal se
puede transformar en una normal tipificada:

Ejemplo: una variable aleatoria sigue el modelo de una


distribución normal con media 10 y varianza 4.
Transformarla en una normal tipificada.

X: N (10, 4)

Para transformarla en una normal tipificada se crea una


nueva variable (Y) que será igual a la anterior (X)
menos su media y dividida por su desviación típica
(que es la raíz cuadrada de la varianza)

En el ejemplo, la nueva variable sería:

Esta nueva variable se distribuye como una normal


tipificada, permitiéndonos, por tanto, conocer la
probabilidad acumulada en cada valor.

Y: N (0, 1)

231
BIBLIOGRAFÍA

1. Bello, León Darío. 2005. Estadística como apoyo a la


Investigación. Editorial L. Vieco e Hijas Ltda.

2. Cabrera, C. and Jaramillo, J. 1997. Estadística


Inferencial. Universidad Técnica de Loja. Ecuador. Pp
510

3. Calzada B, José. 1966. Estadística General con


Énfasis en Muestreo. Editorial Jurídica, S.A. Primera
Edición. Lima – Perú. Pp 518.

4. Casco F., Ignacio. 2006 Introducción a la


probabilidad. Departamento de Estadística.
Universidad Calos III de Madrid. Madrid – España.

5. Daniel, Wayne W. 1988. Bioestadística: Base para el


análisis de las ciencias de la salud. Noriega editores.
Editorial Limusa. Tercera edición. México.

6. Díaz, Ramón et all. 1999. El Análisis de Varianza y


sus aplicaciones. Centro de Estudios Forestales de
Postgrado. Universidad de los Andes. Mérida
Venezuela. Pp 540

232
7. Fantoni C, Héctor. 1975. Distribuciones
Bidimensionales de Frecuencias. Regresión y
Correlación. Segunda Edición. Guayaquil – Ecuador.
Pp 167.

8. _________________ 1980. Generalidades y


Distribuciones Unidimensionales de Frecuencias.
Segunda Edición. Guayaquil – Ecuador. Pp 221.

9. _________________ 1976. Curso de Estadística


General. Análisis Metodológico. Guayaquil – Ecuador.
Pp 217

10. Freese, Frank. Linear Regresión Methods for Forest


Research. Forest Products Laboratory. Forest Service
U.S. Department of Agriculture. Pp 134

11. ____________ 1974. Freese, Frank. Elementary


Statistical Methods for Foresthers Products Laboratory.
Forest Service U.S. Department of Agriculture in
cooperation with the University of Wisconsin.
Agriculture Handbook 317. Washington. United State.
Pp 134

12. Grisales Romero Hugo. 2002. Estadística Aplicada en


Salud Pública: Estadística Descriptiva y Probabilidad.
Editorial L-Vieco e Hijas.

233
13. Hoel, Paul. Estadística Elemental. Nueva Edición. Los
Angeles – California, 1966. Pp 396.
14. Kalton, G. 1974. Introducción a los conceptos
estadísticos. Instituto de Estadística Aplicada y
Computación. Universidad de los Andes. Mérida
Venezuela. Pp 80.

15. Kazmier, Leonardo. 1998. Estadística aplicada a la


administración y a la economía. McGraw Hill
Interamericana de Editores, S.A. Mexico.

16. Laplace, Pierre Simon de. 1988. Ensayo Filosófico


sobre las Probabilidades. Alianza Editorial. El libro de
bolsillo-SEP.

17. Marques de Cantú, María José. Probabilidades y


Estadística. Para Ciencias Químico-Biológicas.
Editorial McGraw-Hill 1991

18. Meyer, Paul. 1973. Probabilidad y Aplicaciones


Estadísticas. Versión en Español. Departamento de
Estadísticas. Universidad Católica de Chile. Fondo
Educativo Interamericano, S.A. Pp 231.

19. Milton, J. Susan, 2001. Estadística para la Biología y


Ciencias de la Salud. Editorial McGraw-Hill. Tercera
Edición. España

234
20. Ogaya, Noel. 1980. Algunos aspectos de regresión y
correlación. Universidad de los Andes. Facultad de
Ciencias Forestales. Mérida venezuela. Pp 97

21. Vidal, Juan. 1984. Estadística. Ejercicios de Inferencia


Estadística. Faculta de Economía. Universidad de los
Andes. Mérida – Venezuela. Pp 70

22. Ya-Lun Chou. Análisis Estadístico. Nueva Editorial


Interamericana, S.A. Primera Edición. Impreso en
Mexico, 1972. Pp 85

235

También podría gustarte