PROBABILIDAD y ESTADÍSTICA
PROBABILIDAD y ESTADÍSTICA
Probabilidad y estadística
Alejandro Nava
Alma Vázquez
Juan Cuéllar
Mario Leal
Rosa Gámez
Rosario Arriaga
Salvador Rodríguez
UANL
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN
Título de la obra:
Probabilidad y estadística
ISBN: 978-607-7967-87-3
Ediciones DeLaurel
Reservados todos los derechos. Queda prohibida la reproducción es una marca registrada de
Comercializadora y Editora de Libros, S. A. de C. V.
o transmisión total o parcial del contenido de la presente obra en
Miembro de la Cámara Nacional de la
cualesquiera formas, sean electrónicas, mecánicas o por fotocopia, Industria Editorial Mexicana, Reg. Núm. 3680.
sin el consentimiento previo y por escrito de la Universidad
Autónoma de Nuevo León y del editor. Cuidado editorial: Equipo DeLaurel
Diseño de portada: La caja, servicios editoriales,
Salem Pérez Coyoc
Impreso en México
Printed in México
Noviembre de 2013
Presentación3
Etapa 2. Probabilidad 29
2.1 Conceptos básicos 29
2.1.1 Probabilidad de eventos 31
Etapa 3. E
stadística descriptiva, parte 1: Descripción y representación
de datos en forma tabular y gráfica 61
Introducción61
Si tu número de cierta rifa es 2222, ¿te sentirías defraudado si el número premiado es el 1234? ¿No
tienen todos los números la misma oportunidad de ganar?
Si en una rifa tienes el boleto 235, y el maestro de ceremonias anuncia “el número ganador empieza con
23”, ¿habrías tenido mayor posibilidad de ganar que si se anuncia directamente el número ganador?
Sin saber realmente qué es la probabilidad, sabemos que se debe poder medir, dado que decimos que
algo es más o menos probable, muy probable o poco probable.
Más aún, sabemos que una probabilidad puede convertirse en certeza (su mayor valor) o resultar
nula (su menor valor). Si de dos estudiantes uno de ellos estudió para un examen mientras que el
otro no, la probabilidad de pasar el examen para el que no estudió se vuelve nula mientras que para
el que sí estudió se vuelve una certeza.
Por ello puede decirse que la probabilidad de un evento es el grado de confianza que se tiene sobre la
ocurrencia de dicho evento.
La probabilidad es la parte de las matemáticas que se encarga del estudio de fenómenos o experi
mentos aleatorios. Un experimento aleatorio es aquel que si se repite bajo las mismas condiciones el
resultado no siempre es el mismo. El ejemplo clásico es el lanzar una moneda o un dado, en donde
sabemos por experiencia que no siempre sale lo mismo.
En esta sección se inicia con un planteamiento sobre la incertidumbre y los distintos grados de incer
tidumbre, relacionándolos de manera intuitiva con los enfoques más tradicionales para asignar pro
babilidades. Posteriormente, se hace una revisión de las técnicas básicas que se utilizan para el conteo
de eventos en un experimento dado, para luego introducir el sentido de la probabilidad en términos
de experimentos aleatorios, espacio muestral, sucesos, etc., llegando al cálculo de la probabilidad en
general, junto con las expresiones de la probabilidad condicionada y los teoremas de la probabilidad
compuesta.
Aproximadamente por el año 3500 a.C., los juegos que involucraban el azar eran practicados con
objetos de hueso, considerados como los precursores de los dados. Dados cúbicos con marcas si
milares a las de los dados modernos han sido encontrados en tumbas egipcias que datan del año
2000 a.C.
Antes de la mitad del siglo XVII, el término “probable” (del latín “probable”, que significaba “acepta
ble”) se aplicaba de la misma manera a las ideas y los hechos. Una acción u opinión probable era una
que las personas sensatas emprenderían o mantendrían, en las circunstancias.
El juego con dados ha sido parte importante en el primer desarrollo de la teoría de la probabilidad.
Probabilidades numéricas para ciertas combinaciones de dados ya habían sido calculadas por Girolamo
Cardano y por Galileo Galilei. Cardano, en su obra “Lanzando los dados”, publicada 87 años después
de su muerte, introduce conceptos combinatorios en cálculos de probabilidad y define la probabilidad
como “el número de resultados favorables dividido por el número de resultados posibles”.
Sin embargo, se acepta generalmente que la teoría matemática de la probabilidad fue iniciada por los
matemáticos franceses Blaise Pascal y Pierre Fermat cuando lograron obtener probabilidades exactas
para ciertos problemas relacionados con los juegos de dados. Antoine Gombaud, conocido como el
Caballero De Mèré, un noble francés con interés en el juego plantea a Pascal una situación a resolver
de un juego de dados.
El problema mencionaba a dos jugadores que debían escoger cada uno un número del 1 al 6, y apues
tan a que lanzando sucesivamente un dado el número elegido aparece en tres ocasiones antes que el
número del contrario; sin embargo, de pronto el juego se ve interrumpido cuando el número de uno
de ellos ha aparecido dos veces y el del otro una sola vez, y la pregunta era, ¿cómo debían dividirse el
total de la apuesta?
Este problema y otros propuestos por De Mèré, llevó a un intercambio de cartas entre Pascal y
Fermat, en las cuales los principios de la teoría de la probabilidad fueron formulados por primera
vez. Aunque algunos problemas especiales en los juegos de azar habían sido resueltos por algunos
matemáticos italianos en los siglos xv y xvi (Cardano, Galilei), ninguna teoría general se desarrolló
antes de esta famosa correspondencia. Actualmente, la probabilidad se ha desarrollado gracias a las
aportaciones de muchos pensadores quienes han contribuido a que sea una parte importante de las
matemáticas.
En muchos casos de la vida diaria es común que se tenga que elegir entre una forma u otra; no
habrá gran dificultad si son pocas las formas entre las que se debe elegir. Por ejemplo, si debes
elegir entre usar pantalón azul o el negro y si usarás zapatos o tenis, no tendrás mucha dificultad
porque sólo tendrás que elegir entre alguna de las cuatro formas que se pueden combinar: pan
talón azul con zapatos, pantalón azul con tenis, pantalón negro con zapatos, o pantalón negro
con tenis.
Las dificultades se presentarían al realizar el conteo de las formas diferentes a elegir cuando interviene
un mayor número de elementos. Por ejemplo, si te dijeran que debes formar equipos de 4 personas
de un grupo formado por 22 mujeres y 18 hombres, o si te pidieran que determinaras el número de
placas diferentes que se pueden formar usando tres letras seguidas de tres números, en estos casos las
cosas cambian pues enumerar los posibles sucesos que ocurren en una situación dada se convierte en
algo difícil o tedioso.
Así, en muchos asuntos tanto de la vida diaria como de las diferentes áreas del conocimiento intervie
ne el conteo.
Las técnicas de conteo son una herramienta útil para enumerar los elementos de una situación en
cuestión que sea difícil de cuantificar. Entre estas técnicas están el llamado principio fundamental de
conteo, las permutaciones y las combinaciones.
Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el número de
formas en que ambos sucesos pueden presentarse en ese orden es de n1 ? n2 formas distintas. Este principio
se puede extender a tres o más sucesos.
Ejemplo 1
Determina el número de formas diferentes en que puede presentarse el resultado al lanzar dos
monedas al aire.
Solución
La primera moneda puede presentar dos resultados y la segunda moneda, dos resultados, por lo
tanto se tienen:
Una forma en la que también se puede encontrar el número total de formas en que se puede pre
sentar un suceso es empleando el diagrama de árbol; éste consiste en utilizar líneas que unen a
las diferentes opciones.
Moneda 1 Moneda 2 Resultados
El principio fundamental de conteo puede utilizarse para cualquier cantidad de eventos sucesivos.
10
Ejemplo 2
Supón que tendrás que contar el número de placas distintas que se pueden hacer con tres dígitos,
de los cuales el primer dígito es diferente de cero. ¿Cuántas placas distintas podrás contar?
Solución
Una de la placas puede ser: 123 , otra podría ser: 124 , y así las diferentes placas. Existen 10 dígi
tos (del 0 al 9), y la placa tendrá tres: en la primera posición puede ir alguno de los números del
1 al 9, en la segunda posición puede ir del 0 al 9 y en la tercera posición del 0 al 9, por lo que se
tendría lo siguiente:
(9)(10)(10) 5 900
Ejemplo 3
Las placas de los automóviles llevan tres letras y cuatro números. ¿Cuántas placas distintas podrás
contar? a) Se pueden repetir las letras y números. b) No se deben repetir las letras y números.
Solución
Nota que para la primera posición se puede elegir una letra de entre 26 letras, en la segunda sólo
se puede elegir de entre 25 letras porque ya se eligió una para la primera posición; para la tercera
posición sólo quedan 24 letras a elegir. De manera similar para los dígitos.
Ejemplo 4
Cinco personas compiten entre sí. ¿De cuántas formas distintas puede terminar la competencia?
Solución
Hay cinco opciones para el primer lugar, cuatro para el segundo (porque en el primer lugar ya se
quedó uno), tres para el tercero, dos para el cuarto y uno para el quinto:
11
1.2.2 Factorial
El factorial es una operación que en ocasiones se emplea en el conteo; se escribe n!, y se define como:
n! 5 (n)(n – 1)(n – 2)… (2)(1)
5! 5 (5)(4)(3)(2)(1)
En ocasiones debes de elegir entre una opción u otra, y cada una de ellas puede presentarse de distinta
manera. En estos casos se suman el número de formas de una opción con el número de formas de la
segunda opción. Observa el siguiente ejemplo.
Ejemplo 5
Irás a comer el día de hoy y puedes elegir entre el restaurante A o el B. En el restaurante A hay a
elegir entre tres platillos y dos bebidas y en el B entre dos platillos y cuatro bebidas. ¿De cuántas
formas distintas podrás comer?
Solución
Las permutaciones que se han revisado consideran que se forman colocando un objeto tras otro for
mando una fila, por lo que hay un primero y un último en la fila. Sin embargo, esto no ocurre si se
colocan uno tras otro formando un círculo. Cuando se colocan personas alrededor de una mesa o
se colocan cuentas en un collar, no existe un primero y un último.
12
b) Pero si se acomodan en forma circular alrededor de una mesa se tendrían los siguientes arreglos:
A A A A A A
C D D C B D D B B C C B
B B C C D D
Para encontrar el número de maneras en que se pueden acomodar objetos de esta manera, denomina
da arreglo circular, se elige una primera posición, y después se colocan los demás uno tras otro en sus
posiciones en forma circular, quedando de (n – 1)! formas diferentes.
Ejercicios
1. ¿De cuántas formas distintas se puede formar una fila de 10 personas?
4. Juan tiene que elegir entre 5 pantalones y 6 camisas. ¿De cuántas maneras distintas puede
hacer la elección?
13
6. En la nevería se ofrecen 6 clases de helados servidos en cono sencillo, doble o triple. ¿De
cuántas maneras distintas se puede comprar el helado?
7. Si al problema anterior se añade que puede agregarse al helado coco espolvoreado o chispas
de chocolate, ¿de cuántas formas distintas puede adquirirse el helado?
8. Alma compró cuatro obsequios distintos para regalar a cuatro de sus comadres. ¿De cuántas
formas puede repartirlos?
9. Si debo visitar a las comadres Brenda, Peggy, Alicia, Laura, Tere, Vicky, Nancy y Lety, ¿de cuan
tas formas distintas puedo hacer el recorrido para visitarlas?
10. Se lanzan tres monedas al aire. ¿De cuántas maneras distintas pueden caer?
11. Se lanzan dos dados, uno blanco y uno negro. ¿Cuántos resultados pueden obtenerse?
12. Se lanza un dado y una moneda. ¿Cuántos resultados distintos se pueden obtener?
13. En un restaurante se ofrecen cuatro platillos diferentes, tres opciones para beber y cinco pos
tres diferentes. ¿Cuántos comidas distintas formadas por un platillo, una bebida y un postre
se pueden ofrecer?
14
14. ¿De cuántas formas distintas puede elegirse el representante y el suplente en el grupo si hay
38 alumnos inscritos?
15. Tienes que realizar tres tareas escolares (matemáticas, español y orientación) y dos tareas de
casa (recoger el cuarto y limpiar el patio).
a) ¿De cuántas formas distintas puedes organizar el orden en que realizarás dichas tareas?
b) Si debes hacer primero las tareas escolares y luego las de casa, ¿de cuántas maneras puedes
organizar el orden en que las realizarás?
16. Piensas darle un regalo a la chica que te gusta y para esto vas a la tienda de peluches. Pero no
te decides entre regalarle un perro o un gato de peluche. Si tienen tres peluches diferentes en
forma de perro y dos peluches diferentes en forma de gato, encuentra el número de formas
en que puedes seleccionar:
a) Un perro y un gato.
b) Un perro o un gato.
18. Supón que vas a comprar una lavadora de ropa, que puedes seleccionar de entre las marcas A,
B y C. Cuando llegas a la tienda encuentras que la lavadora de la marca A se presenta en dos
tipos de carga, en cuatro colores diferentes y puede ser automática o semiautomática, mien
tras que la lavadora de la marca B, se presenta en tres tipos de carga, en dos colores diferentes
y puede ser automática o semiautomática y la lavadora de la marca C, se presenta en un solo
tipo de carga, en dos colores diferentes y sólo hay semiautomática. ¿De cuántas maneras se
puede elegir la lavadora?
15
19. ¿De cuántas maneras diferentes se pueden acomodar nueve personas alrededor de una mesa
circular?
20. Cinco parejas llegan a una fiesta y les asignan una mesa para 10 personas. Determina el nú
mero de maneras diferentes en que pueden sentarse si:
a) No importa la manera en que queden distribuidos.
b) Las parejas no deben separarse, quedando alternados hombres y mujeres.
1.2.4 Permutaciones
La permutación es una clasificación de un número determinado de objetos en cierto orden. Por ejem
plo, con los números 1, 2, 3 y 4 se pueden presentar alguna de las siguientes permutaciones:
Como hay cuatro números a elegir y de acuerdo al principio fundamental de conteo, se pueden pre
sentar las siguientes permutaciones:
Si un conjunto tiene n elementos, entonces el número de permutaciones que se pueden formar está
dado por n!
Ahora si se van a formar permutaciones de dos elementos con esos mismos cuatro números, con base
en el principio fundamental de conteo, se tendría lo siguiente:
Si del conjunto de n elementos se van a formar grupos distintos de r elementos ordenados, donde r # n, entonces
el número total de permutaciones, se escribe P(n, r) y se lee “número de permutaciones de n elementos
tomados de r en r”, está dado por la expresión:
n!
P(n, r) 5
(n – r)!
16
Ejemplo 1
En una competencia se premian 3 lugares. Si hay 20 concursantes, ¿de cuántas formas se podrían
obtener los tres lugares?
Solución
Ejemplo 2
Se van a rifar cinco premios entre los 40 alumnos del salón. ¿De cuántas formas distintas se pue
den entregar los premios?
Solución
40!
P(40, 5) 5 (40 – 5)! 5 78 960 960 formas distintas.
En un conjunto de n objetos, de los cuales n1 son iguales, n2 son iguales, y así hasta nr iguales, el número de
permutaciones está dada por:
n!
P(n; n1, n2, …, nr) 5
(n1!n2! … nr!)
donde n 5 n1 1 n2 .... 1 nr
Ejemplo 3
Encuentra el número de señales diferentes, cada una formada de tres banderas alineadas que se
pueden hacer con un conjunto de dos banderas rojas iguales y una bandera verde.
17
Solución
n1 5 2 (rojas), n2 5 1 (verde), n 5 3
3!
P(3; 2, 1) 5 53
2! ? 1!
Ejemplo 4
¿De cuántas formas distintas se pueden colocar 10 pelotas en una fila si 4 son rojas, 2 son verdes,
3 son azules y una es negra?
Solución
Ejemplo 5
Solución
Se tienen 3 “a”, 1 “e”, 1 “i”, 1 “c”, 2 “m”, 2 “t”, 1 “s”, por lo tanto,
11!
P(11, 3, 1, 1, 1, 2, 2, 1) 5 5 1 663 200
3! ? 1! ? 1! ? 1! ? 2! ? 2! ? 1!
1.2.6 Combinaciones
La combinación se define como cada uno de los diferentes grupos que pueden formarse tomando to
dos o parte de los elementos de un conjunto, sin considerar el orden de los elementos tomados.
Por ejemplo, con las letras A, B, C, tomadas de tres en tres se tendría una sola combinación porque no
importa la forma en que se ordenen.
Por ejemplo, hablar del equipo formado por Juan, Ale y Chava, sería lo mismo que decir el equipo
formado por Ale, Chava y Juan; observa que no importa el orden en que se mencionen, pues sigue
siendo el mismo equipo.
18
Ahora, al considerar combinaciones de dos en dos a partir de las letras A, B, C, se tendrían las combi
naciones:
AB, AC, BC
Debe observarse que AB y BA son dos permutaciones distintas, pero representan una sola combina
ción: la combinación AB.
Si del conjunto de n elementos se van a formar grupos distintos de r” elementos, sin tener en cuenta
su orden, donde r # n, entonces el número total de combinaciones, se escribe C(n, r) y se lee “número
de combinaciones de n elementos tomados de r en r”, está dado por la expresión:
P(n, r) n!
C(n, r) 5 5 r!(n – r)!
r!
También puede escribirse como nCr, Cnr .
Ejemplo 1
Sean las letras a, b, c, d. Se formarán grupos de dos de ellas. Encuentra el número de permutacio
nes y de combinaciones.
Solución
4!
P(4, 2) 5 5 12
(4 – 2)!
4!
C(4, 2)* 5 56
2!(4 – 2)!
* En la calculadora, la tecla nCr permite saber directamente el valor de C(n,r) si se escriben sucesivamente los
valores de n y r.
Ejemplo 2
¿De cuantas maneras se puede formar un equipo de tres personas de un grupo de siete personas?
Solución
Como el orden no importa, se tiene que calcular las combinaciones de un conjunto de siete to
mando 3 a la vez:
7!
C(7, 3) 5 5 35 formas diferentes puede tener el equipo.
3!(7 – 3)!
19
Ejemplo 3
En la preparatoria #1 hay 15 maestros de matemáticas, de los cuales 9 son hombres y 6 son mu
jeres. ¿De cuántas maneras diferentes se puede formar un equipo de 8 maestros integrado por 4
mujeres y 4 hombres?
Solución
Los cuatro maestros se podrán seleccionar a partir de las combinaciones C(9, 4):
9!
C(9, 4) 5 5 126 formas diferentes de seleccionar a los maestros.
4!(9 – 4)!
Las cuatro maestras se podrán seleccionar a partir de las combinaciones C(6, 4):
6!
C(6, 4) 5 5 15 formas diferentes de seleccionar a las maestras.
4!(6 – 4)!
Por lo tanto habrá:
Ejemplo 4
Se formará un comité de cinco personas integrado por un representante, un suplente y tres voca
les. ¿De cuántas formas se puede elegir el comité si en el salón de clase hay 20 alumnos?
Solución
En este caso se debe elegir primero al presidente y el suplente, en dónde sí importa el orden, por
lo tanto se tendrá:
20!
P(20, 2) 5 5 380
(20 – 2)!
Luego se seleccionan las tres vocales, en donde no importa el orden, por lo que se tiene:
18!
C(18, 3) 5 5 816
3!(18 – 3)!
Y por último, de acuerdo al principio fundamental de conteo, se tiene que el número de formas
diferentes será:
20
Ejercicios
1. Evalúa:
a) P(5, 5) b) P(10,3) c) P(40, 5)
d) P(10; 3, 3, 3, 1) e) C(5, 5) f ) C(5, 2)
2. ¿De cuantas formas se pueden elegir 4 bolas de color de un total de 10 bolas de diferente
color?
3. ¿De cuántas maneras se pueden otorgar los 4 primeros lugares en una contienda de atletismo
entre 10 participantes?
5. El mariachi de la prepa tocará 6 piezas musicales en el festival del día de las madres. ¿De
cuántas formas se puede ordenar el programa musical?
7. Se tienen cuatro banderas, dos blancas y dos rojas. ¿Cuántas señales diferentes se pueden
hacer con ellas?
8. Hermilo y Erasmo, dos niños muy inquietos, quieren hacer una fila, en todas las formas posi
bles, usando cinco canicas rojas, dos blancas y tres azules, sin importar el tiempo que tarden.
¿De cuántas maneras se puede formar la fila? ¿Cuánto crees que tardarán en lograrlo?
21
13. Para pasar un examen de matemáticas debes de contestar 14 de 20 problemas. ¿De cuántas
maneras puedes hacerlo?
15. Se dispone de 10 personas para hacer una guardia nocturna de tres personas. ¿Durante cuán
tas noches se podrá tener una guardia diferente?
22
17. En un salón de clases hay 30 alumnos, de los cuales 16 son mujeres y 14 son hombres. Se
debe elegir un equipo formado de cinco alumnos. Determina el número de formas en que
puede seleccionarse el equipo si:
a) No hay restricción si son hombres o mujeres.
b) El equipo estará formado sólo por mujeres
c) El equipo deberá tener dos hombres y tres mujeres.
18. En una pizzería se ofrecen pizzas en cuatro tamaños, con dos formas y con cuatro ingredien
tes. ¿Cuántas pizzas diferentes se pueden ofrecer?
19. ¿Cuántos comités diferentes formados por 2 estudiantes de primer semestre y 3 estudiantes
de tercer semestre se pueden seleccionar entre 15 estudiantes de primer semestre y 12 estu
diantes de tercer semestre?
20. ¿Cuántas expresiones diferentes de dos vocales y dos consonantes se pueden formar con 5
vocales diferentes y 7 consonantes diferentes?
21. Una bolsa contiene 6 bolas rojas, 3 bolas amarillas y 4 bolas azules. ¿De cuántas maneras se
podrán extraer 8 bolas, de tal forma que sean 3 rojas, 2 amarillas y 3 azules?
22. En el juego de póker, hay cuatro figuras: , , , ; hay 13 cartas de cada figura con los núme
ros: 2, 3, 4, 5, 6, 7, 8, 9, 10 y las letras: J, Q, K, A. Se le llama mano al conjunto de 5 cartas.
a) Al repartir las cartas, ¿cuántas manos diferentes pueden salir en el juego?
b) ¿De cuántas maneras diferentes puede salir J, Q, o K?
23
(a 1 b)0 5 1
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5
1
Nota que los coeficientes del binomio corresponden a los números de esta figura llamada triángulo de
Pascal, en honor a Blas Pascal quien lo utilizó en sus trabajos.
24
Por otro lado, la suma de los coeficientes de los términos del binomio desarrollado para una potencia
n dada es siempre igual a 2n.
El binomio a una potencia se utiliza para el conteo en donde la respuesta sólo tiene dos opciones:
“águila o sol”, “sí o no”, “hombre o mujer”, “encendido o apagado”.
(2)(2) 5 4 resultados.
Sin embargo, al usar el binomio, donde águila es “a”, sol es “s” y el exponente es el número de mone
das “2”, se tiene:
En ocasiones es importante determinar claramente el proceso a resolver para evitar errores. Por ejem
plo, si se te pregunta el número de pizzas diferentes que se pueden preparar al ofrecer hasta 3 ingre
dientes, al resolverlo directamente con el principio fundamental de conteo tendrías:
Sin embargo, la solución no es la correcta porque cuando se ofrecen hasta tres ingredientes, por ejem
plo los ingredientes A, B, C, las opciones son 8:
(Sin ingrediente), (con A), (con B), (con C), (con AB), (con AC), (con BC), (con ABC)
25
Debe tenerse claro que al cliente se le preguntaría: ¿Con ingrediente A? ¿Con ingrediente B? ¿Con
ingrediente C? y las respuestas serían “sí” o “no” para cada pregunta. Por lo que este problema corres
ponde a un problema de binomio.
Al resolverlo con el binomio, donde las respuestas son “s” para sí, “n” para no y el número de ingre
dientes es el exponente, se tiene que:
El uso del binomio es muy útil desde el punto de vista biológico, pues los valores a y b pueden repre
sentar algún hecho biológico en el que aparezcan dos opciones. Por ejemplo, el sexo de los descen
dientes sólo puede tener dos opciones: hembra o macho; otro ejemplo puede ser la presencia de un
gene de herencia mendeliana que afecte la salud en su forma recesiva presentándose dos opciones:
enfermo o sano.
Considera una pareja de recién casados que planea tener 3 hijos. Encuentra las posibles formas en que
se pueden presentar los tres hijos.
Tres niños: Dos niños y una niña: Dos niñas y un niño: Tres niñas:
niño, niño, niño. niño, niño, niña. niña, niña, niño. niña, niña, niña.
niño, niña, niño. niña, niño, niña.
niña, niño, niño. niño, niña, niña.
Si “a” representa a los niños, “b” a las niñas y “n” el número de hijos, se tendría lo siguiente:
Observa que cada término del desarrollo del binomio representa cada una de las posibilidades:
En total hay 1 1 3 1 3 1 1 5 8 maneras diferentes en que dicha pareja puede tener 3 hijos.
26
Ejercicios
1. Desarrolla el binomio (a 1 b)3.
4. Se lanzan al aire tres monedas y se observa el resultado. ¿Cuántas y cuáles son las formas en
que se puede presentar el resultado?
5. Si se lanza una moneda al aire en tres ocasiones, una tras otra, ¿será igual que en el ejercicio
anterior?
6. Se lanzan al aire seis monedas y se observa el resultado. ¿Cuántas y cuáles son las formas
en que se puede presentar el resultado?
7. ¿De cuántas maneras distintas puede ocurrir que al lanzar 4 monedas salgan exactamente
3 águilas?
27
9. Raúl le sugiere ofrecer pizzas hasta con 6 ingredientes; si Carmen lo hace así, ¿cuántas opcio
nes tendrán para elegir?
10. En Nava´s pizzería, el de la competencia, dice en su publicidad que con los ingredientes que
ofrece a elegir pueden preparar hasta 512 pizzas diferentes. ¿Cuántos ingredientes tiene dis
ponibles?
11. Una pareja planea tener 3 hijos. Encuentra las posibles formas en que se pueden presentar los
tres hijos.
12. Una pareja planea tener 4 hijos. Encuentra las posibles formas en que se pueden presentar los
cuatro hijos.
13. Una pareja portadora de un gene que produce cierta enfermedad que se trasmite por herencia
recesiva simple planea tener tres hijos. En la descendencia los hijos pueden ser sanos o enfer
mos. ¿Cuáles son las formas en que se puede presentar la descendencia?
14. Durante un concurso sólo debes de contestar sí o no. Si te hacen 7 preguntas, ¿de cuántas
maneras puedes dar tus respuestas?
15. En un examen las respuestas son de falso – verdadero. Si en el examen hay 5 peguntas, ¿de
cuántas formas diferentes puedes contestar?
28
2
2.1 Conceptos básicos
Probabilidad: Valor entre cero y uno, inclusive, que describe la posibilidad relativa de que ocurra un
evento. Se representa con la letra p. Por ejemplo, la probabilidad de A se representa como p(A).
El lanzar una moneda, el lanzar un dado, el participar en una rifa, son ejemplos de procesos que pro
ducen un resultado.
Si se lanza una moneda, el resultado es que caiga águila o sol; si se tira un dado, como resultado puede
caer alguna de sus seis caras.
Espacio muestral: También es llamado espacio probabilístico. Son todos los posibles resultados de
un experimento; es el conjunto de valores obtenidos. Se representa con la letra W. Cualquier resultado
experimental particular se llama punto muestral y es un elemento del espacio muestral. Por ejemplo:
al lanzar una moneda al aire, al caer puede resultar águila o sol, por lo que el espacio muestral está
formado por dos elementos:
29
Al lanzar dos dados de diferente color, en cada dado puede caer alguna de sus seis caras, por lo que se
tendría el siguiente espacio muestral con 36 resultados diferentes:
Dado 1
1,1 2,1 3,1 4,1 5,1 6,1
2,1 2,2 2,3 2,4 2,5 2,6
Dado 2 3,1 3,2 3,3 3,4 3,5 3,6
4,1 4,2 4,3 4,4 4,5 4,6
5,1 5,2 5,3 5,4 5,5 5,6
6,1 6,2 6,3 6,4 6,5 6,6
Evento o suceso: Es cada uno de los resultados posibles de un experimento aleatorio. Es un subcon
junto del espacio muestral. Puede estar formado por uno o más resultados del experimento aleatorio.
Por ejemplo:
Evento seguro: Es el que está formado por todos los posibles resultados de un experimento, esto es
un conjunto total de elementos. Ocurre siempre que se realice el experimento. Su probabilidad es 1.
Evento imposible: Es el que no tiene elementos por lo que es un conjunto vacío, por lo tanto nunca
se realiza la probabilidad del suceso. Se representa con [.
Evento simple o elemental: Es el suceso formado por un solo elemento, por un solo resultado. Cada
uno de los elementos del espacio muestral.
Experimento aleatorio: Es el que puede dar lugar a varios resultados, sin que pueda ser previsible
enunciar con certeza cuál de estos va a ser observado en la realización del experimento a pesar de ha
30
berlo realizado en similares condiciones. Por ejemplo: el lanzar una moneda al aire, es un experimento
aleatorio, lo que significa que su resultado es al azar, y en este caso puede caer águila o sol.
Experimento determinístico: Es un experimento no aleatorio. Cuando se realiza bajo las mismas con
diciones, provoca los mismos efectos, es decir, siempre se obtiene el mismo resultado. Por ejemplo: al
lanzar un objeto al aire, éste siempre caerá.
Cuando se habla de varios eventos dentro del mismo experimento se pueden dar varios casos:
Si dos o más eventos no pueden ocurrir simultáneamente, se llaman eventos mutuamente excluyen-
tes, es decir, que la intersección de ambos eventos es conjunto vacío. Si existe intersección entre los dos
eventos, entonces se les llama eventos no excluyentes.
Si un evento o más eventos dependen de otro evento previo, es decir, un evento A ocurre dado que
ocurrió un evento B, se dice que son eventos dependientes o condicionados (el evento A depende del
evento B). Por otro lado, si no existe tal relación entre eventos se dice que son eventos independientes.
La probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relativas de
ocurrencia del evento de acuerdo a la regularidad estadística. Esta definición sería la más real, pero
proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales.
Además, los resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo.
La probabilidad clásica de un evento E, que se denota por p(E), se define como el número de resul
tados que componen al evento E, entre el número de resultados que componen el espacio muestral:
número de resultados del evento E
p(E) 5
número total de resultados del espacio muestral
En esta definición se considera que todos los resultados o eventos elementales tengan la misma pro
babilidad de ocurrir.
31
Sin embargo, en los casos anteriores existe una diferencia: en los dos primeros casos para estimarla
se debe considerar información y opiniones personales, en cambio en los dos siguientes, es necesario
recurrir a información disponible de lo sucedido en eventos anteriores, y en los dos últimos, puede
determinarse a partir del número de eventos posibles.
Con base en lo anterior, y según el enfoque que se le dé, la probabilidad puede clasificarse de la si
guiente forma:
Subjetiva
Probabilidad Frecuencial
Clásica
La probabilidad clásica se define como el cociente entre el número de resultados favorables y los po
sibles si todos tienen la misma posibilidad de presentarse.
Ejercicios
1. Para cada uno de los siguientes escenarios, identifica si al determinarlos se trataría de pro-
babilidad subjetiva, frecuencial o clásica.
32
b) Es poco probable que el día de hoy reciba más llamadas que de costumbre.
h) Se debe determinar la probabilidad de que la leche dure más de cuatro meses en buenas con
diciones.
i) De acuerdo a los registros que hay en la prepa de los exámenes de diagnóstico, los resulta
dos muestran que en el 2009, de 950 alumnos inscritos 250 de ellos tenían dificultades para
resolver problemas razonados. Si en agosto de este año se van a inscribir 1 200 alumnos,
¿cuántos puede esperarse que tengan dificultades con los problemas razonados?
j) La probabilidad es muy alta para que esta vez sí gane el equipo de casa.
33
P(A) $ 0.
P(V) 5 1.
3. Si dos sucesos son mutuamente excluyentes, es decir, que no ocurren simultáneamente, entonces
la probabilidad del suceso compuesto por ambos es la suma de las probabilidades de cada uno de
los sucesos:
Tomando en cuenta que la probabilidad de un evento, por definición, es la frecuencia relativa, enton
ces se tienen lo siguiente:
0 # p(A) # 1
p(S) 5 1
34
Teorema 5: Si A y B son dos eventos, entonces P(A – B) 5 P(A) – P(A > B).
Teorema 6: Si A y B son dos eventos, entonces P(A < B) 5 P(A) 1 P(B) – P(A > B).
La probabilidad clásica de un evento E, se escribe p(E), se define como el número de resultados que
componen al evento E, entre el número de resultados que componen el espacio muestral:
número de resultados del evento E
p(E) 5
número total de resultados del espacio muestral
En ocasiones se llama resultados favorables a los resultados del evento E, cuya probabilidad se desea
determinar, por lo que a veces se escribe como:
número de resultados favorables
p5
número total de resultados
Ahora, si se dice que un evento puede ocurrir en “n” distintas maneras, igualmente posibles, y si “a”
son las maneras consideradas como aciertos (resultados favorables), en tanto que “b”, son considera
dos fallos (resultados desfavorables), entonces la probabilidad de acierto “p” está definida por la razón
entre casos favorables y el total de casos:
a a
p 5 o
p5
n a1b
Y la probabilidad de que el evento no ocurra “q” está definida por la razón entre el número de fracasos
y el total de casos, se tiene:
b b
q 5 o
q5
n a1b
Si se suman la probabilidad de los aciertos con los fracasos se tiene:
a b a1b
1 5 51
a1b a1b a1b
35
Por lo tanto:
p1q51
p51–q
q51–p
Estas ecuaciones indican que si la probabilidad de que ocurra un evento es “p” entonces la probabili
dad de que no ocurra es “1 – p”; o bien, si la probabilidad de que no ocurra un evento es “q”, entonces
la probabilidad de que sí ocurra es “1 – q”.
Ejemplo 1
Al tirar una moneda al aire, puede caer “águila” o “sol”, ¿cuál es la probabilidad de que caiga
“águila”?
Solución
número de resultados del evento E
p(E) 5
número total de resultados del espacio muestral
1 evento águila
p(águila) 5
2 eventos posibles
1
p(a) 5
2
Ejemplo 2
¿Cuál es la probabilidad de que al tirar dos monedas al aire caigan dos águilas?
Solución
Al tirar dos monedas al aire, su espacio muestral es: (a, a), (a, s), (s, a), (s, s), esto es 22; la proba
bilidad de que caigan dos águilas será:
36
También habrás observado que para encontrar la probabilidad es importante definir claramente
el espacio muestral, a fin de determinar el número de eventos favorables, así como la totalidad
de eventos.
Ejemplo 3
Solución
Ejemplo 4
Una pareja planea tener tres hijos. a) Encuentra la probabilidad de que tengan dos niñas y un
niño. b) Determina la probabilidad de que tengan un niño, una niña y una niña, en ese orden.
Solución
Si “a” representa a los niños, “b” a las niñas y “n” el número de hijos, se tendría lo siguiente:
37
b) El evento niño 1 2 niñas corresponde al tercer término del desarrollo del binomio, y esto
puede presentarse de tres formas distintas, una de las cuales es la que se busca, por lo tanto la
probabilidad de niño, niña, niña, es:
1
p(niño, niña, niña) 5 5 0.125 ó 12.5%
8
Ejemplo 5
En una urna hay 20 bolas de las cuales 4 son negras. Si se sacan al azar dos bolas, ¿cuál es la pro
babilidad de que ambas sean negras?
Solución
El espacio muestral está formado por la extracción de dos bolas de 20, esto es la combinación:
C(20, 2).
Dado que hay 4 bolas negras de las cuales se extraerán 2 se tiene: C(4, 2).
Ejercicios
1. Se tira un dado.
a) Escribe el espacio muestral.
b) ¿Cuál es la probabilidad de obtener un 6?
c) ¿Cuál es la probabilidad de obtener un número non?
d) ¿Cuál es la probabilidad de que no salga 3?
(Nota en este último que es más fácil calcular primero la probabilidad de que sí salga el 3 y luego
encontrar su complemento).
38
4. Se saca una carta de un mazo normal de 52 cartas. Determina la probabilidad para cada caso:
a) La carta que se saca sea “J”.
b) La carta que se obtiene sea “J”, “Q” o “R”.
c) La carta que se obtiene sea negra.
d) La carta sea un ocho de corazones.
5. Se tiene una caja con 5 pañuelos rojos, 3 verdes y 2 blancos. Si se saca, sin ver, un pañuelo,
encuentra la probabilidad de que:
a) Sea verde.
b) Sea blanco.
c) Sea rojo.
6. Se tiene una caja con pelotas de igual tamaño pero distinto color. Si hay 2 blancas, 3 rojas y
3 verdes, encuentra la probabilidad de que al extraer una pelota, sin ver, ésta no sea:
a) Blanca.
b) Verde.
c) Roja.
39
7. Se lanza un dado y una moneda al mismo tiempo. Se gana si sale “águila y par”. ¿Cuál es la
probabilidad de que ocurra?
8. Alma compró para regalar una caja con 12 chocolates, de los cuales 4 vienen rellenos de vai
nilla, pero todos lucen igual. En eso vienen las comadres Brenda y Peggy y toman dos choco
lates. ¿Cuál es la probabilidad de que tomen dos chocolates rellenos de vainilla?
9. Mario tiene tres pantalones de diferente color (azul, café y negro) y cinco camisas también
de diferente color (blanca, negra, azul, café y gris). Si Mario escoge una combinación al azar,
¿cuál es la probabilidad de que se vista con pantalón azul y camisa blanca?
10. En el salón de clase, 8 alumnos usan lentes. ¿Cuál es la probabilidad de que al elegir uno al
azar use lentes?
11. En el salón de clase hay 10 alumnos que van a Facpya, 8 que van a Medicina, 6 que van a
Mecánica, 4 que van a Química y 4 aún no se deciden. Al aplicar una encuesta a uno de ellos,
¿cuál es la probabilidad de que el encuestado sea el que va a Facpya?
12. Se tira una moneda al aire. ¿Cuál es la probabilidad de que salga águila?
15. Se lanzan dos dados. ¿Cuál es la probabilidad de que salga una suma igual a 4?
16. Se lanzan dos dados. ¿Cuál es la probabilidad de que salga una suma igual a 8?
40
17. Se lanza un dado. ¿Cuál es la probabilidad de que salga un número mayor que 5?
18. Se lanzan dos dados. ¿Cuál es la probabilidad de que salga una suma mayor que 5?
Si dos eventos A y B son mutuamente excluyentes, la regla de adición indica que la probabilidad de
que ocurra A o B es igual a la suma de sus probabilidades respectivas (ver axioma 3):
41
Ejemplo 1
c) ¿Cuál será la probabilidad de que un vuelo haya llegado antes de tiempo o demorado?
Ejemplo 2
Se lanza al aire una moneda tres veces, determinar la probabilidad de que: a) El resultado sean
puros soles, b) Salgan dos águilas, c) Aparezcan por lo menos dos águilas.
Solución
Espacio muestral
Moneda 1 Moneda 2 Moneda 3 Resultado Probabilidad simple
Águila AAA 1/8
42
A 5 {SSS}, entonces:
b)
Si B 5 evento de que aparezcan dos águilas:
5 3/8
5 0.375
Ejemplo 3
Al tirar seis monedas al aire, ¿cuál es la probabilidad de que caigan al menos 4 águilas?
Solución
43
Los eventos favorables son que caigan al menos 4 águilas, esto es que caigan 4 águilas o más, por
lo tanto son: C(6, 4) 1 C(6, 5) 1 C(6, 6).
número de resultados favorables
La probabilidad es: p(E) 5
número total de resultados
C(6, 4) 1 C(6, 5) 1 C(6, 6)
p(al menos 4 águilas) 5
64
15 1 6 1 1
p(E) 5
64
22 11
p(E) 5 5 5 0.34375
64 32
También puede emplearse el desarrollo del binomio para determinar los resultados favorables,
observa:
Si los dos eventos A y B son mutuamente no excluyentes, la regla de adición indica que la probabi
lidad de que ocurra A o B es igual a la suma de sus probabilidades respectivas menos su intersección
(Ver teorema 6):
A AB B
P(A o B) 5 P(A<B) 5 P(A) 1 P(B) – P(A > B)
Para entender esto considera el lanzamiento de un dado: puede resultar 1, 2, 3, 4, 5, ó 6, todos con
igual probabilidad de salir, por lo que la probabilidad de cada uno es 1/6.
Si se pregunta: ¿cuál es la probabilidad de que salga 2 ó 5? Se puede notar que no pueden salir ambos
a la vez; son independientes uno del otro.
44
En cambio, si la pregunta es: ¿cuál es la probabilidad de que salga 4 ó un número mayor o igual que
3? En este caso el evento es p(4 ó mayor o igual a 3), lo que nos da:
5 p(4) 1 p(3, 4, 5, 6)
Podrás notar que al salir un número mayor o igual que 3 se incluirá al 4, el cual ya está conside
rado en p(4), por lo tanto no son excluyentes. Al calcular la probabilidad debe excluirse la inter
sección “4”. Por lo tanto la probabilidad es:
Ejemplo 1
Se lanzan dos dados, uno blanco y uno negro. Considera su espacio muestral. Encuentra la pro
babilidad de que salga un 2 en el dado blanco o un 3 en el dado negro.
Solución
Espacio muestral:
Dado blanco
1,1 2,1 3,1 4,1 5,1 6,1
2,1 2,2 2,3 2,4 2,5 2,6
Dado negro
Si A 5 salga 2 blanco, B 5 salga 3 negro, pero se puede observar que el resultado (3, 2) es la in
tersección, entonces:
P(A o B) 5 6 1 6 – 1
36 36 36
5 11/36 5 0.305
45
Ejemplo 2
Se tiene un circuito eléctrico con dos lámparas, A y B, en paralelo; se ha determinado que la pro
babilidad de que funcione la lámpara A es de 0.9 y la de la lámpara B, es de 0.8; además, la
probabilidad de que funcionen A y B simultáneamente es de 0.75. ¿Cuál será la probabilidad de
que funcione bien el circuito?
Solución
En algunos problemas para calcular la probabilidad de un evento es más sencillo resolverlo cal
culando la probabilidad del complemento. En el siguiente ejemplo se calcula la probabilidad del
complemento.
Ejemplo 3
En una determinada población, el 70% son aficionados al fútbol, el 60% al tenis y el 65% al
baloncesto. El 45% lo son al fútbol y al tenis, el 40% al tenis y al baloncesto y el 50% al fútbol y
al baloncesto, mientras que el 30% lo son a los tres deportes. ¿Cuál es la probabilidad de que un
individuo escogido al azar no sea aficionado a ninguno de los tres deportes?
Solución
Pensando al contrario, es decir, calculamos en primer lugar la probabilidad de que sea aficionado
al menos a uno de los tres.
Por lo tanto:
46
Ejercicios
1. Si A, B, y C tres eventos mutuamente excluyentes, cuyas probabilidades son: P(A) 5 0.40,
P(B) 5 0.35, y P(C) 5 0.55. Encuentra la probabilidad de cada inciso.
a) P(A o B) 5 b) P(A o C) 5 c) P(B o C) 5
2. Determina, para cada inciso, si los eventos A y B de un experimento dado son mutuamente
excluyentes o no (existe intersección o no).
a) El experimento consiste en lanzar dos dados, uno blanco y uno negro, en donde:
A 5 sale un 4 en el dado blanco, B 5 sale un 4 en el dado negro.
b) El experimento consiste en lanzar dos dados, uno blanco y otro negro, y se registra el re
sultado, en donde:
A 5 dado blanco es un número par, B 5 dado negro es un número impar.
d) El experimento consiste en lanzar dos dados de distinto color, se registra la suma, en donde:
A 5 hombre, B 5 mujer.
A 5 es alto, B 5 usa lentes.
47
3. En una caja, que contiene carretes de hilo del mismo tamaño, hay 8 rojos, 5 verdes y 7 azules.
Si se saca un carrete sin ver, ¿cuál es la probabilidad de que éste sea rojo o azul?
4. Se lanzan al aire tres monedas: una moneda de un peso, una de dos pesos y una de cinco pesos.
a) Escribe el espacio muestral.
b) ¿Cuál es la probabilidad de obtener tres águilas?
c) ¿Cuál es la probabilidad de obtener al menos dos águilas?
d) ¿Cuál es la probabilidad de obtener águila con la moneda de dos pesos?
e) ¿Cuál es la probabilidad de obtener un águila en la de un peso y un sol en la de dos pesos?
f) ¿Cuál es la probabilidad de obtener tres águilas?
6. Se tiene una caja con 6 pañuelos rojos, 5 verdes y 4 blancos. Si se saca, sin ver, un pañuelo,
encuentra la probabilidad de que sea verde o blanco.
7. Alma tiene en una cajita varios carretes de hilo del mismo tamaño, entre los cuales hay 6
rojos, 6 verdes y 6 blancos. Si ella saca un carrete sin ver, ¿cuál es la probabilidad de que éste
sea rojo o blanco?
8. Sean los eventos A y B, no excluyentes, y las probabilidades de algunas relaciones entre ellos
son: P(A<B) 5 7/8, P(A>B) 5 1/4, P(Ac) 5 5/8. Encuentra:
a) P(A) 5 b) P(B) 5
48
10. Emplea un diagrama de Venn para explicar la probabilidad de tres eventos no excluyentes.
Ejemplo 1
Se lanzan una moneda y un dado. Determina la probabilidad de que salga 5 en el dado y águila
en la moneda.
Solución
Dado
Moneda 1 2 3 4 5 6
49
Ejemplo 2
Considera que en una caja hay cuatro bolas blancas y cinco bolas azules.
a) Si se saca una bola y se regresa (se reemplaza) y luego se saca otra bola, ¿cuál es la probabilidad
de que ambas sean azules?
Solución
La probabilidad de que la primera bola sea azul es 5/9, y la probabilidad de que la segunda sea
azul es 5/9, por lo tanto la probabilidad de que las dos sean azules es:
( 59 )( 59 ) 5 25
81
5 0.31
b) Si se saca una bola y luego se saca otra bola, sin reemplazar ninguna, ¿cuál es la probabilidad
de que ambas sean azules?
Solución
La probabilidad de que la primera bola sea azul es 5/9, y la probabilidad de que la segunda sea
azul es 4/8, pues ya se sacó una bola, por lo tanto la probabilidad de que las dos sean azules es:
( 59 )( 48 ) 5 72
20 10
5
36
5 0.2727
Nota que este último problema se puede resolver como si se hubieran sacado dos bolas azules a
la vez, por lo tanto sería:
C(5, 2) 10
5 5 0.2727
C(9, 2) 36
Ejemplo 3
Considera que lanzas un dado y luego sacas, sin ver, una bola de una caja en la que hay 4 bolas
blancas, 2 rojas y 3 verdes. ¿Cuál es la probabilidad de sacar una bola roja y de obtener un 3 con
el dado?
Solución
5 (C(2,
C(9, 1) )( 6 )
1) 1
50
5 ( 29 )( 16 )
2 1
5 5 5 0.037
54 27
Ejemplo 4
En una urna hay 5 canicas verdes, 4 canicas blancas y 3 canicas rojas. Si se extrae una canica, ésta
se regresa después de ver su color. ¿Cuál es la probabilidad de que al extraer una canica y luego
otra, sean roja la primera y verde la segunda?
Solución
Ejemplo 5
En un estudio que se hizo en la prepa se encuentra que el 35% de los estudiantes estudian
música, el 40% habla inglés y el 25% va a la escuela caminando. Si se selecciona de manera
aleatoria a un estudiante de la prepa y se asume que los eventos son independientes, ¿cuál es la
probabilidad de que al seleccionar un estudiante, éste estudie música, hable inglés y llegue a la
escuela caminado?
Solución
5 (0.35)(0.40)(0.25)
5 0.035
En ocasiones se requiere calcular la probabilidad de cierto evento, pero para ello es más sen
cillo conocerla utilizando la probabilidad del evento complementario. Observa los siguientes
ejemplos:
51
Ejemplo 6
¿Cuál es la probabilidad de que en el salón de clase cuando menos dos personas tengan la misma
fecha de cumpleaños?
Solución
Suponiendo que hay 30 alumnos en el salón de clases y que cada uno de los 365 días del año
pueden ser fechas de cumpleaños con igual probabilidad. Para una persona dada, la probabilidad
de cumplir años en un día del año es 1/365 y la probabilidad de no cumplir años en ese día es
364/365.
Al examinar el evento complementario se tiene que no hay dos alumnos que tengan la misma
fecha. Por lo tanto, partiendo de un día dado que sea una fecha de cumpleaños del alumno “1”,
la probabilidad de que cumpla años en ese día es 1, la probabilidad de que la fecha del segundo
sea distinta de la del primero es 364/365, que la del tercero sea distinta de las dos primeras es
363/365, y así sucesivamente.
P(hay dos con la misma fecha) 5 1 – P(no hay dos con la misma fecha)
5 1 – 0.29368
5 0.70632
Ejemplo 7
Una prueba de laboratorio que se utiliza para detectar cierta enfermedad es efectiva el 90% de las
veces. Si los resultados de las pruebas son independientes, ¿cuántas pruebas deben realizarse en
un paciente para detectarle la enfermedad con una certeza del 99.95%?
Solución
La probabilidad de que la prueba falle es del 10% ó 0.1; la probabilidad de que falle n veces es
(0.1)(0.1)…(0.1) 5 0.1n; y lo que se busca es que este valor sea menor o igual al 0.05%, por lo
tanto:
0.1n # 0.0005
Y empleando logaritmos:
52
log0.1n # log0.0005
nlog0.1# log0.0005
n( – 1) # ( – 3.3)
n $ – 3.3/ – 1
n $ 3.3
Ejercicios
1. Sean A, B, y C tres eventos independientes, cuyas probabilidades son:
P(A) 5 0.40, P(B) 5 0.35, y P(C) 5 0.25.
Encuentra la probabilidad de cada inciso:
a) P(A y B) 5 b) P(A y C) 5 c) P(B y C) 5 d) P(A y B y C) 5
2. Si se deja caer una bola como se muestra, encuentra, para cada figura, la probabilidad de lle
gar a la salida A.
A B C A B
3. Se lanza un primer dado y luego un segundo dado. ¿Cuál es la probabilidad de que salga
primero un 2 y luego un 3?
4. En una caja hay tres bolas de igual tamaño: una roja, una blanca y una azul. ¿Cuál es la pro
babilidad de que al extraer una bola, sin ver, sea roja?
5. Si se lanza una moneda tres veces, ¿cuál es la probabilidad de que salga águila, luego sol, y
luego águila?
53
6. Si en el salón de clase hay 50 personas, ¿cuál es la probabilidad de que cuando menos dos
personas tengan la misma fecha de cumpleaños?
8. En una bolsa hay dulces de igual tamaño, uno con empaque verde y el otro con empaque azul.
a) Si se extrae un dulce, sin ver, ¿cuál es la probabilidad de que sea verde?
b) Si se extrae un dulce y luego se regresa, y se vuelve a extraer un dulce, (extracción con re
emplazo), ¿cuál es la probabilidad de que sean los dos del mismo color?
9. Se tiene una urna con 3 canicas rojas, 4 verdes y 5 blancas. Si se saca una canica, determina la
probabilidad de que:
a) Sea roja.
b) Sea verde
c) Sea blanca.
10. Se tiene una urna con 3 canicas rojas, 4 verdes y 5 blancas. Se extrae una canica, se ve el color,
se regresa a la urna y se saca otra, y se ve el color. ¿Cuál es la probabilidad de que la primera
sea roja y la segunda sea verde?
11. Hay una caja con 12 chocolates, de los cuales 4 vienen rellenos de vainilla, pero todos lucen
igual. Otra vez vienen las comadres, primero Brenda toma uno y luego Peggy toma otro.
¿Cuál es la probabilidad de que a Brenda y a Peggy les toque chocolate relleno de vainilla?
54
12. En un salón de clase hay 10 niñas y 8 niños. Tres niñas y cuatro niños usan anteojos. Si se
elige un alumno al azar, determina la probabilidad de que el alumno elegido:
a) Sea niño. b) Sea niña. c) Use anteojos.
d) Use anteojos o sea niño. e) Use anteojos y sea niño.
14. Determina la probabilidad de que al tirar un dado tres veces, una tras otra, se obtenga “1, 2, 3”.
15. Una maquinita de apuestas tiene tres ruedas (y una palanca). Al tirar de la palanca, las ruedas
giran de manera independiente. Cada rueda tiene, entre números y figuras, 11 posiciones di
ferentes. ¿Cuál es la probabilidad de que después de tirar de la palanca las ruedas se detengan
en la misma figura?
La probabilidad de que ocurra el evento A dado que ya ocurrió B se denota como P(A|B).
P(A|B) se lee “p de A dado B” y significa “la probabilidad del evento A, dado que
el evento B ocurre”.
B
Por ejemplo, considera un cuadrado formado a su vez por 16 cuadritos:
A
La probabilidad de que ocurra el cuadrito A: es 1/16.
55
Sin embargo, la probabilidad de que ocurra el mismo cuadrito una vez que ya ha ocurrido B, se escribe
P(A|B), es 1/4.
Al lanzar dos dados, uno blanco y uno negro, su espacio muestral es el siguiente:
Si se plantea la pregunta, ¿cuál es la probabilidad de que la suma dé un número mayor que 6 sabiendo
que en el dado blanco se obtuvo un número menor que 3?
Para resolverlo debes considerar que A 5 (la suma mayor que 6) y B 5 (blanco menor que 3), por lo
tanto, ya que el dado blanco es un número menor que 3 y que la suma de los dos dados debe ser mayor
que 6 al señalarlos en la tabla del espacio muestral se tiene lo siguiente:
Se puede observar que, “A”, los dados con suma mayor que 6 son 21 casos; y que, “B”, dado blanco
menor que 3 son 12 casos.
Sin embargo, al considerar “A” condicionado a que el dado blanco debe ser menor que 3, entonces se
reduce el número de casos a 3.
Nota que la condición “la suma mayor que 6” y “blanco menor que 3” es la intersección de A y B,
A B, y por lo tanto la probabilidad de A condicionado por B es:
3
P(A|B) 5 5 0.25
12
56
Ya que P(A|B) resulta ser el cociente de (A>B) y (B), entonces se tiene que:
(A>B)
P(A|B) 5 .
(B)
O bien, si se consideran las probabilidades en lugar del número de casos se tiene que:
3
36 3
P(A|B) 5 5 5 0.25
12 12
36
Por lo que P(A|B) también se puede calcular como el cociente de P(A>B) y P(B), esto es:
P(A>B)
P(A|B) 5
P(B)
A B
Considera ahora el siguiente ejemplo.
1
2 1
N4
57
a) Determina la probabilidad de que al extraer una bola, ésta sea roja si ya se sabe que se seleccionó
la urna A (Nota que la probabilidad de bola R está condicionada por A).
3
Solución:
P(A>R) 8 3
P(R|A) 5 5 5
P(A) 1 4
2
b) Si se ha sacado una bola roja, determina la probabilidad de que la bola provenga de la urna A
(observa que ahora la probabilidad de urna A está condicionada por R).
3
P(A>R) 8 3
P(A|R) 5 5 5
P(R) 5 5
8
En resumen, se tiene lo siguiente:
A
P(R/A) R P(RA)
P(A)
P(N/A) N P(NA)
B
P(B) P(R/B) R P(RB)
P(N/B) N P(NB)
P(A>R)
P(R>A) 5 P(A)P(R|A) y despejando P(R|A) 5
P(A)
P(A>N)
P(N>A) 5 P(A)P(N|A) P(N|A) 5
P(A)
P(B>R)
P(R>B) 5 P(B)P(R|B) P(R|B) 5
P(B)
P(N>B)
P(N>B) 5 P(B)P(N|B) P(N|B) 5
P(B)
58
Ejercicios
1. Se tienen dos urnas, A y B, con 2 canicas rojas y 2 canicas negras en la urna A y 1 canica roja en
la urna B. Se realiza un experimento en dos tiempos, primero se selecciona la urna por un pro
cedimiento aleatorio y posteriormente de la urna elegida se extrae una bola aleatoriamente.
a) Elabora un diagrama para representar el experimento.
b) Determina las probabilidades correspondientes a cada rama del diagrama.
c) Determina la probabilidad de extraer una bola roja si ya se ha seleccionado la urna A.
d) Si se ha extraído una bola roja, determina la probabilidad de que se haya sacado de la urna A.
2. Se tienen dos urnas con bolas de colores. En la urna A hay 3 bolas rojas, 2 bolas blancas y 3 bolas
verdes; en la urna B hay 2 bolas rojas y 2 verdes. Se saca una bola al azar de alguna de las urnas.
a) Si la bola es roja, ¿cuál es la probabilidad de que provenga de la urna A?
b) Si la bola es verde, ¿cuál es la probabilidad que se haya sacado de la urna B?
3. Sea un conjunto de 50 personas, de la cuales 30 son casadas, 15 son graduadas y 10 son casa
das y graduadas.
a) Traza una figura que represente el espacio muestral.
b) ¿Cuál es la probabilidad de que al escoger una persona ésta sea casada, sabiendo ya que la
persona escogida es graduada?
c) ¿Cuál es la probabilidad de que al escoger una persona ésta sea graduada, sabiendo ya que
la persona escogida es casada?
4. Un 55% de los alumnos de la prepa han aprobado Matemáticas, un 70% ha aprobado Filosofía,
y un 50% ha aprobado ambas materias. Si se elige al azar un estudiante, calcula la probabili
dad de que:
a) Haya aprobado al menos una de las dos materias.
b) Haya reprobado ambas materias.
c) Si aprobó Matemáticas, ¿cuál es la probabilidad de haber aprobado Filosofía?
59
5. Supón que en la prepa el 45% de los estudiantes reprueba Matemáticas, el 60% reprueba Física
y el 30% reprueba ambas. Si se selecciona al azar un alumno:
a) Si reprobó Física, ¿cuál es la probabilidad de que reprobará Matemáticas?
b) Si reprobó Matemáticas, ¿cuál es la probabilidad de que reprobará Física?
6. De acuerdo al INEGI, en el estado de Nuevo León habitan 3.2 millones de personas mayores
que se consideran población económicamente activa. 2.5 millones ganan menos de cinco sala
rios mínimos; de éstas 625 000 son personas entre 15 y 29 años. Si se selecciona un habitante
de Nuevo León al azar, ¿cuál es la probabilidad de que ésta gane menos de cinco salarios y su
edad esté entre 15 y 29 años?
60
Introducción
La estadística es una ciencia que facilita la solución de problemas en los cuales necesitamos conocer
algunas características sobre el comportamiento de algún suceso o evento. Características que nos
permiten conocer o mejorar el conocimiento de ese suceso. Además, nos permiten inferir el compor
tamiento de sucesos iguales o similares sin necesidad de que estos ocurran.
Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, así como realizar proyecciones del
comportamiento de algún suceso.
Lo anterior es posible ya que sólo se realizan los cálculos y el análisis con los datos obtenidos de una
muestra de la población y no con toda la población. Pues hacerlo con todos los datos o población en
algunos casos sería muy difícil y en otros casos casi imposible.
Desde un punto de vista amplio, se puede decir que la estadística es la ciencia que estudia cómo debe
emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incer
tidumbre.
Afortunadamente se aplica en cualquier campo, sin importar qué tan sencillo o complicado sea. Cuanto
más complicado es, más ayuda nos presta para resolver la situación.
Ahora bien, la materia prima de la estadística consiste en conjuntos de números obtenidos al contar
o medir cosas. Los cuales se deben recolectar, organizar, resumir, presentar, hallar regularidades y así
como analizarlos; de esto se encarga la Estadística descriptiva. Una vez hecho lo anterior, se pueden
analizar los datos realizando inferencias a partir de ellos, obtener conclusiones válidas, con la finalidad
de ayudar a la toma de decisiones y en su caso formular predicciones; de esto se encarga la Estadística
inferencial.
61
En este primer acercamiento que tienes con la estadística se muestran sus elementos básicos. A partir
de un conjunto de datos numéricos x1, x2, . . ., xn, que representan mediciones de alguna variable de in
terés, se revisan los métodos de cómo organizarlos en tablas de frecuencias, representarlos con gráficas,
para posteriormente calcular ciertas medidas de tendencia central como la media, moda y mediana; se
calculan las llamadas medidas de dispersión como la varianza, la desviación estándar y el coeficiente
de variación. Por último se analizan datos bivariados.
Hacia el año 3000 a.C., los babilónicos usaban pequeñas tablillas de arcilla para recopilar datos en
tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque.
Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirá
mides en el siglo xi a.C.; debido a las periódicas inundaciones, eran frecuentes los recuentos de tierras
y utensilios.
Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El pri
mero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las
diversas tribus judías.
En China, existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos
realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos.
De todos es conocido el famoso censo de población del emperador Augusto. Los romanos, además
de censos de población, registraban recuentos de nacimientos y defunciones, sobre la población
agrícola, etc.
Fue John Graunt quien puso las bases de una estadística moderna, realizando
un trabajo a partir de las tablas de mortalidad de la ciudad de Londres.
En dicha obra puede observarse información sobre la geografía, la división política, la economía, edu
cación, las finanzas gubernamentales, así como la demografía del estado en esa época. Actualmente, el
INEGI es el encargado de concentrar y publicar la información estadística del estado y del país.
62
Durante el siglo XX, la creación de instrumentos precisos para asuntos de salud pública (epidemio
logía, bioestadística, etc.) y propósitos económicos y sociales (tasa de desempleo, econometría, etc.)
necesitó de avances sustanciales en las prácticas estadísticas.
Hoy en día, el uso de la estadística se ha extendido más allá de sus orígenes. Personas y organizaciones
usan la estadística para entender datos y tomar decisiones en ciencias naturales, sociales, medicina,
negocios y otras áreas.
En su origen, por tanto, la estadística estuvo asociada a datos para ser utilizados por el gobierno, en
particular, hacia los censos que suministraban información regular acerca de la población. Actualmente
es una herramienta imprescindible en cualquier área del quehacer humano.
La Estadística es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para des
pués obtener conclusiones a partir de ellos. De manera general, la estadística puede ser dividida en dos
grandes áreas: Estadística descriptiva y Estadística inferencial.
Se denomina población, al conjunto bien definido de todos los individuos, de donde se observa o
será observada cierta característica. El número de integrantes de la población, llamado tamaño de la
población, se representa con la letra N. Las poblaciones pueden ser finitas o infinitas.
Una población de personas puede ser “Los estudiantes de la preparatoria Núm. 16 inscritos en el
año escolar 2009 – 2010”.
Una población de animales es “Los perros domésticos de los habitantes del área metropolitana
de Monterrey”.
Una población de plantas es “Las palmas datileras sembradas en los espacios verdes del área me
tropolitana de Monterrey”.
Una población de insectos puede ser “El hormiguero que se encuentra en el patio de la casa”.
63
Una población de cosas puede ser “Los semáforos instalados en la ciudad de Monterrey”.
Una población también puede ser “La sangre presente en un individuo o en un conjunto de in
dividuos dados”.
En suma, una población puede ser aquella formada por personas, animales o cosas que tengan una
característica que pueda ser identificada y se pueda medir.
La población estadística es el conjunto de todos los datos que se obtienen al realizar la medición de
una variable en los elementos de una población.
Una muestra es un subconjunto de una población, que intenta reflejar las características de la pobla
ción lo mejor posible. Dado que no es posible o resulta poco práctico revisar a toda la población, gene
ralmente sólo se examina una pequeña parte de ella. El número de individuos que integran la muestra,
llamado tamaño de muestra se representa con la letra n; así, cuando se hace algún estudio, se habla,
por ejemplo, de una muestra de estudiantes, una muestra de plantas, una muestra de sangre, las cuales
representan a la población en estudio.
Se llama individuo al elemento de la población o de la muestra que porta información sobre lo que
se estudia. El individuo hace referencia a los elementos que integran a la población; sin embargo, los
elementos a estudiar de una población además de personas pueden ser animales u objetos o cualquier
cosa que pueda ser medida o pueda ser calificada.
Se llama variable, a la característica o propiedad de los individuos u objetos que se desea estu
diar y se puede medir o calificar; es una característica que cambia o varía con el tiempo en un
individuo dado, o cambia o varía de elemento a elemento en una población en estudio. Así por
ejemplo, se habla de la edad, del peso, de la estatura, de la temperatura corporal, del número de
hijos, del sexo, del estado civil, del grado máximo de estudios, por mencionar algunos. La varia
ble se representa con una letra, por ejemplo, x, y, P, T, o cualquier otra letra relacionada con el
nombre de la variable.
Se llama dato al valor que se obtiene al realizar la medición de la característica de la variable en es
tudio. Los datos que se van a analizar son recolectados de un conjunto de individuos que se desea
estudiar. Si los datos provienen de una sola variable se les llama datos univariados; si proceden de dos
variables, datos bivariados; y si proceden de más de dos variables, datos multivariados.
La naturaleza de los datos puede ser de dos clases: datos cuantitativos, como son los valores obtenidos al
medir el peso, la estatura, la temperatura, el número de hijos, y datos cualitativos, que en este caso se obtie
nen al calificar la característica en cuestión como lo es el sexo, el estado civil o el grado máximo de estudios.
De acuerdo a la clase de datos, las variables pueden ser cuantitativas, cuando en la medición se asig
nan números, o pueden ser cualitativas, cuando solamente se pueden asignar atributos o categorías.
La edad, el peso y la estatura son ejemplos de variables cuantitativas en una población de personas,
mientras que el sexo y el estado civil son variables cualitativas.
64
Se llama variable dicotómica a aquella que sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mu
jer, encendido – apagado, bueno – defectuoso). Según sea la variable de donde provengan los datos, se
puede hablar de datos cualitativos o datos cuantitativos.
En la variable cuantitativa se pueden distinguir dos tipos: la continua y la discreta. Si al realizar la me
dición la variable puede tomar como valor cualquier número real entre dos valores dados (dentro de
un intervalo) se le llama variable continua; por ejemplo, el peso de los individuos de una población
es una variable continua. Si al realizar la medición se tiene que la variable sólo puede tomar como
valores números enteros, se le llama variable discreta; por ejemplo, el número de hijos en una familia.
Para realizar la medición de la variable se toma como referencia alguna escala de medición. Las escalas
de medición se clasifican como: escala nominal, escala ordinal, escala de intervalo y escala de razón.
La escala nominal, está asociada a variables cualitativas y es denominada de este modo si no se pue
den hacer operaciones aritméticas entre sus valores, pues éstos son únicamente etiquetas.
Por ejemplo:
Si se está estudiando una población, a la variable sexo podemos asignarle dos posibles valores:
Sexo: F M
F para femenino, y M para masculino; ésta es entonces una escala nominal pues los símbolos
F y M son etiquetas arbitrarias, no existe orden en ellos, y no podemos realizar operaciones
aritméticas.
Los casos de variables dicotómicas, el código postal del lugar en que viven las personas, los nú
meros telefónicos, el número que te asigna al correr en el maratón, tu número de matrícula, el
deporte favorito de los estudiantes, la clase de carrera a estudiar, entran en esta clase de escala.
Nota que aún y cuando algunos son números, no se hacen operaciones con ellos.
La escala ordinal, es para los valores de la variable que tienen un orden, con un nivel específico,
pero no se pueden hacer operaciones aritméticas entre estos valores.
Por ejemplo:
Para calificar las características de un objeto se pueden usar los siguientes valores:
En este caso la escala de medición de la variable en cuestión es ordinal, pues existe un orden entre sus
valores, pero el concepto distancia entre ellos no tiene sentido pues no podemos decir, por ejemplo, que
dos valores regulares hacen un valor excelente, o que un valor dado es la mitad o la cuarta parte de otro.
65
La escala de intervalo, en ella existe un orden entre los valores de la variable y existe además una
noción de distancia aunque no se pueden realizar operaciones. Esto ocurre con algunas escalas
de medición.
Por ejemplo:
0 10 20 30 40 50 60 70 80 90 100 °C
Nota que 10°C está a 10 unidades abajo que 20°C. Sin embargo, el calor que existe con una tem
peratura de 20°C no es el doble para una temperatura de 10°C; o bien 20°C no es igual a 20°F.
En esta clase de escalas el cero o punto de inicio no es único, es más bien un punto de referencia. Otro
ejemplo es la edad de la Tierra, o la línea del tiempo de la humanidad, en donde la edad varía según
sea el acuerdo que tomen los especialistas en un momento dado.
La escala de razón, en ella la magnitud tiene un sentido físico, existe el cero absoluto, el cual hace
referencia a que la cantidad no existe en ese valor. Existe un orden en los valores, de tal manera que la
distancia entre dos valores es la diferencia de ellos, incluso se puede determinar cuántas veces es mayor
un valor que otro.
El peso, la estatura, la edad, la distancia, capital (dinero), o todo aquello que pueda utilizarse como
referencia a los números de una recta numérica, son ejemplos de esta escala.
Los datos estadísticos se obtienen a partir de diferentes fuentes, entre las cuales se encuentran la en-
cuesta, el experimento o la investigación documental.
La encuesta consiste en recopilar los datos mediante el uso de cuestionarios o entrevistas. El cuestio
nario que contestas cada semestre sobre las cualidades de tus maestros, es un ejemplo. Las entrevistas
en donde te dicen “me permite hacerle una encuesta” ya sea vía telefónica, en el centro comercial, o
cuando llegan a tu casa, son formas de recopilar información estadística.
66
Ejercicios
Identifica si la variable es cuantitativa o cualitativa.
67
f) La cantidad de sangre que tiene cada una de las personas de este salón de clase.
12. Identifica la clase de escala en que están las siguientes variables. Propón una escala con sus
unidades.
68
l) La cantidad de sangre que tiene cada una de las personas de este salón de clase.
o) Calidad de un producto.
Alumno Calificación
A.N.S. 90
A.R.V. 100
J.A.C. 90
M.A.L. 80
R.M.G. 95
S.R.V. 85
69
Si bien es cierto que los datos están acomodados en tablas, alineados en columna, éstos no están
ordenados desde el punto de vista estadístico. Para poder analizarlos es necesario organizarlos. Para
ello se ordenan los datos, posteriormente se concentran en tablas de valores y por último se visualizan
mediante gráficas.
Al realizar un análisis estadístico el primer paso es ordenar la información. Hay dos métodos comunes
para ordenarlos: listado en orden ascendente y el método de tallo y hojas.
Por ejemplo, considera que se va a estudiar la variable peso en un grupo de 50 alumnos. Se realiza la
medición de cada uno de los alumnos y se obtiene lo siguiente:
1. Se localiza el valor más pequeño, se marca para no volverlo a contar, y se coloca en una nueva lista.
Datos de los pesos de 50 alumnos (kg) Datos de los pesos de 50 alumnos (kg)
40 43 48 51 49 50 64 55 51 53 39
56 44 42 55 52 56 46 59 47 56
52 62 44 50 59 39 51 55 49 52
63 50 56 56 45 48 60 53 51 61
57 66 63 51 58 50 46 54 48 54
70
2. Se localiza el siguiente valor que sigue al más pequeño, se marca para no volverlo a contar, y se co
loca en la nueva lista.
Datos de los pesos de 50 alumnos (kg) Datos de los pesos de 50 alumnos (kg)
40 43 48 51 49 50 64 55 51 53 39 40
56 44 42 55 52 56 46 59 47 56
52 62 44 50 59 39 51 55 49 52
63 50 56 56 45 48 60 53 51 61
57 66 63 51 58 50 46 54 48 54
Datos de los pesos de 50 alumnos (kg) Datos de los pesos de 50 alumnos (kg)
40 43 48 51 49 50 64 55 51 53 39 40 42 43 44 44 45 46 46 47
56 44 42 55 52 56 46 59 47 56 48 48 48 49 49 50 50 50 50 51
52 62 44 50 59 39 51 55 49 52 51 51 51 51 52 52 52 53 53 54
63 50 56 56 45 48 60 53 51 61 54 55 55 55 56 56 56 56 56 57
57 66 63 51 58 50 46 54 48 54 58 59 59 60 61 62 63 63 64 66
El procedimiento consiste en lo siguiente: si los números de los datos están formados por dos dígitos, se hace
una columna con el primer dígito (las decenas) de los datos y a la derecha de cada uno de ellos se escribe, en
fila, sólo el segundo dígito (las unidades) de cada uno de los datos que tengan el mismo primer dígito.
71
Posteriormente se hace un nuevo tallo y hojas con los datos ordenados en forma ascendente:
Datos ordenados:
3 9.
4 0, 2, 3, 4, 4, 5, 6, 6, 7, 8, 8, 8, 9, 9.
5 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 5, 5, 5, 6, 6, 6, 6, 6, 7, 8, 9, 9.
6 0, 1, 2, 3, 3, 4, 6.
En caso de que los datos tengan tres dígitos, se procede de manera similar, sólo que para formar la
columna (tallo) se tomarían dos dígitos.
Datos ordenados:
3 9.
4 0, 2, 3, 4, 4.
4 5, 6, 6, 7, 8, 8, 8, 9, 9.
5 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4.
5 5, 5, 5, 6, 6, 6, 6, 6, 7, 8, 9, 9.
6 0, 1, 2, 3, 3, 4.
6 6.
Los procedimientos anteriores son métodos utilizados para mostrar la información de manera ordena
da. Pero es de aclarar que son utilizados cuando no se dispone de equipo como las computadoras, las
cuales, una vez capturados los datos, hacen el ordenamiento de manera inmediata.
2. Se agrega una segunda columna en donde se van registrando, mediante una línea vertical, las veces
que aparece el valor dado.
72
Por ejemplo, considera que se registra el color de la ropa que traen los alumnos de este grupo, obte
niéndose lo siguiente:
rosa, azul, blanco, azul, rosa, gris, café, negro, rosa, azul,
gris, blanco, café, negro, beige, verde, rosa, beige, gris, rosa,
rosa, azul, café, blanco, blanco, verde, azul, beige, rosa, negro,
gris, azul, blanco, rosa, gris, azul, beige, blanco, negro, azul,
gris, blanco, café, negro, beige, verde, rosa, beige, gris, rosa.
Azul
Beige
Blanco
Café
Gris
Negro
Rosa
Verde
Luego se agrega una segunda columna en donde se registrarán las veces que aparece cada color me
diante una línea vertical o raya. Si un color dado aparece una vez se pondrá una raya, si aparece dos
veces, se pondrán dos rayas y así sucesivamente se pondrá otra raya más por cada ocasión que aparezca
dicho color. También debe recordarse marcar o tachar de la lista original al color que se ha registrado
en la columna a fin de no volverlo a contar:
Color Conteo
Azul ||||| |||
Beige ||||| |
Blanco ||||| ||
Café ||||
Gris ||||| ||
Negro |||||
Rosa ||||| |||||
Verde |||
73
Ejercicios
1. Ordena en forma ascendente los datos siguientes:
Datos de las altura de 50 alumnos (cm) Datos de las altura de 50 alumnos (cm)
155 160 170 165 180 160 175 170 180 185
160 170 177 182 167 169 174 175 178 188
158 160 165 168 170 165 180 175 170 168
165 160 175 185 174 177 182 174 170 166
168 165 170 168 178 170 160 165 175 170
2. Se registra el peso de 70 individuos que pertenecen a cierta escuela; después de pesarlos se
obtiene la siguiente tabla:
Tabla de los pesos (kg)
50 52 42 40 50 57 46 41 52 56
58 54 55 45 43 43 50 56 43 59
50 35 50 54 55 57 52 49 57 49
52 41 52 61 52 42 52 54 43 52
61 54 52 40 45 55 56 52 48 63
56 41 58 48 54 56 58 54 55 56
56 62 56 44 48 56 58 43 57 58
or el método de tallo y hojas, ordena los datos en forma ascendente. Si es necesario utiliza un
P
doble tallo.
74
La tabla de frecuencia es básicamente una tabla de valores x - y, donde la “x” representa al dato y “y”
representa las frecuencias. La frecuencia es el número de veces con que se presenta cada dato.
Además, en esta tabla de datos se pueden agregar otras columnas relacionadas con la frecuencia, éstas
son la columna de frecuencia relativa, frecuencia porcentual y la frecuencia acumulada.
Hay dos clases de tablas de frecuencias: una para datos no agrupados y la otra, para datos agrupados.
75
Por lo regular, a la tabla anterior se le agregan otras columnas relacionadas con las frecuencias; éstas
son la columna de la frecuencia relativa “fr” y la columna de la frecuencia acumulada “fa”.
La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el total de datos, esto es fr 5 f/n.
La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las frecuencias de un dato dado.
Observa que la frecuencia acumulada del primer valor, “39”, es su frecuencia “1”; para el segundo va
lor, “40”, es su frecuencia más la del anterior, lo que da un total de 2 frecuencias; para el tercer valor,
“42”, es su frecuencia más la acumulada en el segundo valor, lo que da un total de 3 frecuencias, y así
sucesivamente.
76
Así por ejemplo, en lugar de hablar del dato 45 kg, se puede hacer referencia del intervalo 43 - 47, que
incluye a todos los valores que están entre 43 y 47 kg.
En el caso anterior el 43 y el 47 son llamados límites de clase del intervalo, en donde el “43” es llamado lí-
mite inferior del intervalo y el “47”, límite superior del intervalo; el valor central, “45”, es llamado punto medio
o marca de clase del intervalo, mismo que se representa con “xi” o “mc”. La marca de clase se obtiene así:
límite inferior 1 límite superior
Marca de clase 5
2
El intervalo anterior al 43 - 47 sería el 38 - 42; el intervalo posterior sería el 48 - 52, y así sucesivamen
te, todos los intervalos deben ser del mismo tamaño, que en este caso es de 5 unidades. El tamaño se
obtiene mediante la diferencia de los límites superior e inferior.
Tabla de intervalos:
Observa que entre el primer intervalo 38 - 42 y el segundo intervalo 43 - 47, entre el límite superior
“42” y el límite inferior “43”, existen ciertos valores, por lo que la frontera real entre estos dos intervalos
es 42.5, la cual es llamada frontera de clase o límite verdadero del intervalo, de tal manera que los límites
verdaderos del primer intervalo serían 37.5 - 42.5, los del segundo: 42.5 - 47.5, y así sucesivamente.
77
Puedes notar que en esta última tabla los límites se convierten en valores comunes. Si los datos son
valores continuos, representaría un serio problema cuando se tenga como dato un valor igual al
límite verdadero, por ejemplo el dato 42.5, ¿dónde debería ponerse? ¿En el primero o en el segundo
intervalo?
En estos casos debe tomarse alguna decisión para ubicar dichos datos, y todos deben ubicarse bajo el
mismo criterio. Por ejemplo, puede decidirse que el límite superior pertenezca al siguiente intervalo.
En la tabla de valores puede incluirse la manera en que serán integrados los intervalos empleando la
simbología de las desigualdades, como se muestra en los siguientes ejemplos:
El tamaño del intervalo de clase se refiere al “ancho” del intervalo, o sea la distancia que hay entre el
límite inferior y límite superior, por lo que el tamaño del intervalo no se refiere a la cantidad de datos
que lo forman. Su tamaño puede variar según sea el número de valores que forman la variable, pero
todos los intervalos de clase deben tener el mismo tamaño.
Cuando se agrupan los datos, el número de intervalos, por lo general, es de 5 a 10. Su número ade
cuado dependerá de las características de los datos, y de la experiencia que tenga la persona que los
analiza. En ocasiones conviene seleccionar un tamaño tal que permita que el punto medio sea un valor
fácilmente reconocible.
78
Por ejemplo, en los intervalos 40 – 44, 45 – 59, los puntos medios son 42, 47; en cambio, en los interva
los de 43 – 47, 48 – 52, los puntos medios son 45, 50, valores que son más fáciles de recordar y operar.
El ancho del intervalo puede variarse no sólo para tener puntos medios fáciles de operar, también pue
de modificarse para tener una mejor perspectiva del conjunto de datos.
Por ejemplo, observa cómo a partir del mismo conjunto de datos se obtienen diferentes figuras al cam
biar el ancho del intervalo de 0.5 a 1.0 y 1.5 unidades.
0.4
0.3
0.2
0.3
0.2
0.2
0.1
0.1
0.1
0.5 1.5 2.5 3.5 4.5 5 0.5 1.5 2.5 3.5 4.5 5.5 6.5 0.5 1.5 2.5 3.5 4.5 5.5 6.5
Ahora bien, si por alguna razón no es fácil tomar la decisión para elegir el ancho del intervalo y el nú
mero de ellos, entonces se puede utilizar la siguiente fórmula:
K 5 1 1 3.3log(n)
Donde: K 5 número aproximado de clases.
n 5 número de datos.
79
El primer paso para elaborarla es definir los intervalos con sus puntos medios.
Por ejemplo, tomando como referencia de los pesos de 50 alumnos medidos en kilos y considerando
los puntos medios de 40, 45, 50, 55, 60 y 65, quedarían los siguientes intervalos:
El siguiente paso es contabilizar las frecuencias correspondientes a cada intervalo. Para el primer inter
valo, se cuentan las frecuencias para los números que estén entre 38 y 42: en este caso son 3 frecuencias
(del 39, 40 y 42); al segundo intervalo, 43 - 47, le corresponden 7 frecuencias; y así sucesivamente.
80
A la tabla anterior se le pueden agregar las columnas relacionadas con la frecuencia relativa y acumu
lada. Como ya se mencionó, la frecuencia relativa se obtiene mediante el cociente de la frecuencia y el
total de datos; la frecuencia acumulada se obtiene sumando las frecuencias anteriores a la frecuencia
de un dato dado. La tabla siguiente lo ejemplifica.
Adicionalmente, a la tabla anterior se le pueden agregar otras columnas relacionadas con las frecuen
cias como son la columna para frecuencia porcentual, que se representa como “f %” o con “%f”, la
que se obtiene multiplicando la frecuencia relativa por 100, la columna para la frecuencia relativa
acumulada, que se representa con “fra”, que se obtienen sumando las frecuencias relativas anteriores
a un dato dado, y la columna para la frecuencia porcentual acumulada, representada como “%fa”
que se obtienen sumando las frecuencias porcentuales anteriores a un dato dado. También se puede
agregar una columna más a la izquierda de la columna de intervalo de clase, en la que se enumeran los
intervalos. La siguiente tabla es un ejemplo.
1 38 - 42 40 3 0.06 6 3 0.06 6
2 43 - 47 45 7 0.14 14 10 0.20 20
3 48 - 52 50 17 0.34 34 27 0.54 54
4 53 - 57 55 13 0.26 26 40 0.80 80
5 58 - 62 60 6 0.12 12 46 0.92 92
6 63 - 67 65 4 0.08 8 50 1.00 100
Total 50 1.00 100
81
Ejercicios
1. Completa los intervalos e identifica los puntos medios para cada tabla.
2. Completa los puntos medios que faltan y escribe los intervalos correspondientes a esos pun
tos medios.
3. A partir de la siguiente tabla escribe una nueva tabla con los límites verdaderos.
82
4. Para cada tabla en la que están los puntos medios como referencia y usando la simbología
de las desigualdades escribe los intervalos con sus límites verdaderos, considera que el límite
superior pertenece al siguiente intervalo.
d) ¿Con qué frecuencia se presentan días que promedian temperaturas entre 22 y 27°C?
83
Color Conteo f fr f%
Azul ||||| |||
Beige ||||| |
Blanco ||||| ||
Café ||||
Gris ||||| ||
Negro |||||
Rosa ||||| |||||
Verde |||
Total
7. Elabora una tabla de frecuencias sin agrupar para los siguientes datos:
2, 3, 4, 6, 3, 4, 5, 3, 4, 4, 6, 2, 6, 1, 7, 3, 5, 4, 4, 3.
8. Elabora una tabla de frecuencias para datos agrupados, empleando cuatro intervalos, con la
siguiente información:
84
b) Elabora una tabla de frecuencias para cada variable, con las frecuencias absolutas, porcen
tuales y acumuladas.
85
11. Los siguientes datos representan las cantidades que gastan en comestibles semanalmente 40
familias. Elabora una tabla de frecuencias de datos agrupados.
2 710 3 630 1 590 760 2 270 3 370 2 950 3 190 3 500 2 980
2 500 2 790 2 050 2 790 2 660 1 990 1 770 1 620 3 420 1 880
2 320 3 030 1 920 1 800 3 200 3 090 2 460 2 800 2 780 3 000
2 970 1 700 1 880 3 200 4 290 2 940 5 700 3 420 2 890 3 250
12. El maestro de matemáticas va a analizar las calificaciones obtenidas por el grupo en el exa
men indicativo. Quiere organizarlos como datos agrupados, sin embargo, como aún no está
seguro si el tamaño de intervalo convendrá de 5 o de 10 unidades, entonces decide que tú lo
hagas por él. Por ello tendrás que elaborar dos tablas de frecuencias, una para datos agrupa
dos de 5 en 5 y otra con datos agrupados de 10 en 10. El maestro también te dice que para
ambos casos una de las marcas de clase debe ser 85.
Calificaciones obtenidas por el grupo:
50 72 86 62 24 64 62 64 82 80
60 66 54 44 50 64 62 60 50 84
60 72 82 60 72 74 28 68 90 32
34 88 82 40 90 25 68 70 68 100
Del grupo 2
1. Morelia 10 4 15 16 33
2. Monterrey 17 3 27 11 30
3. América 16 5 15 13 29
4. Puebla 6 3 19 0 26
5. Pachuca 7 3 7 24 –5 24
6. Chiapas 8 17 –5 19
86
Del grupo 3
Existen dos tipos de gráfica más usuales en la estadística: el polígono de frecuencias y el histograma.
Las siguientes figuras son ejemplos de esta clase de gráficas:
Otras clases de gráficas que también se utilizan, son la gráfica de barras y el pictograma. Ejemplo de
esto son las siguientes figuras:
Altura
Gráfica de barras en dm Pictograma
15 Altura
8
7 en dm
6 15
Frecuencia
absoluta
8
5
7
10
4
6
Frecuencia
3
absoluta
2
5 10
4 5
1 3
0
Perro 2 Pájaro Hámster Gato 5
1
0 Mascota
Perro Pájaro Hámster Gato Niñas Niños
Mascota
Niñas Niños
87
25%
35% Perro
25% Pájaro Perro
CURSO [Link] 87
35% 19/11/13 12:25
Hámster
3 15
abs
Frec
8 2
7 1 5
6 0
Frecuencia
absoluta
5 Perro Pájaro Hámster Gato 10
4
3
Mascota
2 Niñas Niños
1 5
0
Perro Pájaro Hámster Gato
Mascota
Niñas Niños
Etapa 3
25%
Otra clase más de gráfica utilizada en estadística es el gráfico circular, también
35% Perro llamada gráfica de pastel,
como lo muestra la siguiente figura: Pájaro
Hámster
25% 20% Gato
35%
20% Perro
Pájaro
Hámster
20% Gato
20%
25
f
20
15
25 10
f
20 5
15 0
1 2 3 4 5 6 7
10 xi
5
Se traza de manera similar a la gráfica de una ecuación o de una función, a partir de una tabla de fre
cuencias, en donde el eje “x” representa
0
1
al dato
2 3
x4i y el
5
eje6 “y”7representa a las frecuencias f.
xi
Ejemplo
38 - 42 40 3
43 - 47 45 7
48 - 52 50 17
53 - 57 55 13
58 - 62 60 6
63 - 67 65 4
Total 50
88
f 20
f 20
Solución 15
15
10
Se traza un eje de coordenadas adecuado a los da 10
tos, en el eje “x” estarán los
5 puntos medios y en el
eje “y” las frecuencias; se escribe la escala en cada eje 5
0
y se rotulan con los nombres de las variables, en este
5 10 15 20 25 30 35 40 45 50 55 60
0 65 70
caso con “xi” y “f” : 5 10
x 15 20 25 30 35 40 45 50 55 60 65 70
i
xi
Luego se localizan los pares ordenados (xi, f), y se unen con segmentos de línea:
f 20
f 20
15
15
10
10
5
5
0
5 10 15 20 25 30 35 40 45 50 55 60
0 65 70
5 10
xi 15 20 25 30 35 40 45 50 55 60 65 70
xi
Se agregan dos puntos más con frecuencia cero, uno antes y uno después de los datos dados, en
este caso en el valor 35 y otro en el valor 70, con el fin de darle la forma de un polígono cerrado,
quedando lo siguiente:
f 20
f 20
15
15
10
10
5
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
5 10 15 20 25 30 35 40 45 50 55 60 65 70
xi
xi
Polígono de frecuencias
Polígono de frecuencias
f 20
f 20
15
15
10
10
5
5
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
5 10 15 20 25 30 35 40 45 50 55 60 65 70
xi
xi
89
Polígono de frecuencias
CURSO [Link] 89 f 20 Polígono de frecuencias 19/11/13 12:25
f 20
10
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70
xi
Etapa 3
Polígono de frecuencias
f 20
Podrás notar que en la figura existe un vacío entre
los valores xi del 0 al 35. En estos casos se puede 15
recortar el eje, marcando el corte con un par de pe 10
queñas líneas inclinadas, quedando de la siguien 5
te forma:
0
35 40 45 50 55 60 65 70
xi
Polígono de frecuencias
f 20
15
Una variante para indicar el corte del eje es usar
10
una línea quebrada como la siguiente:
5
0
35 40 45 50 55 60 65 70
xi
El eje “y” en donde se localizan las frecuencias (frecuencias absolutas) puede ser sustituido por las
frecuencias relativas o las frecuencias porcentuales. El procedimiento de elaboración es el mismo, sólo
que se utiliza como referencia la columna de frecuencia relativa o la columna de frecuencia porcentual.
90
Polígono de frecuencias
%f 40
35
CURSO [Link] 90 19/11/13 12:25
30
0,35
xi
0,3
0,25
0,2
0,15
Polígono de frecuencias
0,1
%f 40
0,05
35
0
35 40 45 50 55 60 65 7030
x25
Estadística
i descriptiva, parte 1
20
15
Y para el polígono de frecuencias usando la frecuencia porcentual queda así:
10
Polígono de frecuencias 5
%f 40 0
35 40 45 50 55 60 65 70
35
xi
30
25
20
15
10
5
0
35 40 45 50 55 60 65 70
xi
3.6.2 Histograma f 25
38 - 42 40 3
43 - 47 45 7
48 - 52 50 17
53 - 57 55 13
58 - 62 60 6
63 - 67 65 4
Total 50
91
0
10
5 10 15 20 25 30 35 40 45 50 55 60 65 70
5 xi
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70
Y por último, se le pone un título a la figura, de Histograma
xi
acuerdo a los datos dados: f 20
15
Histograma
10
f 20
5
15 Histograma
0
f 10
20 5 10 15 20 25 30 35 40 45 50 55 60 65 70
5
15 xi
0
10
Histograma
5 10 15 20 25 30 35 40 45 50 55 60 65 70
92 5 xi
f 20
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70
Histograma
15
xi
10
f 20
CURSO [Link] 92 5 Histograma 19/11/13 12:25
xi
Histograma
f 20
15
10 Estadística descriptiva, parte 1
5
Aquí también se puede observar
0
que en la figura existe un vacío entre los valores xi del 0 al 35. En
estos casos se puede recortar el5 eje,
10 15marcando el40
20 25 30 35 corte
45 50con un65
55 60 par
70 de pequeñas líneas inclinadas,
quedando de la siguiente forma: xi
Histograma
f 20
15
10
5
0
35 40 45 50 55 60 65 70
xi
El eje “y” en donde se localizan las frecuencias (frecuencias absolutas) puede ser sustituido por las
frecuencias relativas o las frecuencias porcentuales. El procedimiento de elaboración es el mismo,
sólo que se utiliza como referencia la columna de frecuencia relativa o la columna de frecuencia
porcentual.
Histograma Histograma
fr 0,4 % f 40
0,35 35
0,3 30
0,25 25
0,2 20
0,15 15
0,1 10
0,05 5
0 0
35 40 45 50 55 60 65 70 35 40 45 50 55 60 65 70
xi xi
93
Una variante en el histograma es colocar el eje x de manera vertical de tal manera que las colum
nas quedarán de forma horizontal. Esta clase de arreglo es muy común realizarla cuando se ma
nejan datos poblacionales, formándose una figura denominada pirámide poblacional.
Edad
85 y más 0.21 0.29
80-84 0.22 0.27 2000
75-79 0.41 0.45
70-74 0.59 0.66
65-69 0.78 0.88
60-64 1.05 1.15
55-59 1.23 1.33
50-54 1.62 1.73
45-49 1.96 2.11
40-44 2.49 2.70
35-39 3.02 3.33
30-34 3.38 3.75
25-29 3.86 4.30
20-24 4.30 Histograma 4.77 Histograma
15-19 4.91 5.08
10-14 5.44 5.30
fr 0,4 % f 40
5-9 5.68 0,35 5.54 35
0-4 5.40 0,3 5.23 30
6 5 4 3 2 0,25
1 0 1 2 3 4 5 6 25
0,2 20
Millones de habitantes 15
0,15
0,1 10
0,05 5
0 0
35 40 45 50 55 60 65 70 35 40 45 50 55
En la gráfica puede leerse la cantidad de personas, ya sea hombres o mujeres, para xi
cada uno de los
diferentes grupos de edades. Por ejemplo, en el año 2000 había 4.91 millones de hombres y 5.08
millones de mujeres con edades entre 15 y 19 años. Si la gráfica muestra información de hace 10
años, ¿podrías determinar el grupo al que pertenecías tú?
3.6.3 Ojiva
La ojiva es la representación gráfica de las frecuencias acumuladas mediante un gráfico de línea. En él
se muestra la distribución de frecuencias acumuladas de los datos, y se forma con segmentos de línea
de manera similar al polígono de frecuencias.
f 80
Se traza de manera similar a la gráfica de una ecuación o de 70
una función, a partir de una tabla de frecuencias acumuladas, 60
50
en donde el eje “x” representa al dato xi y el eje “y” representa 40
a las frecuencias “f a”. 30
20
10
0
1 2 3 4 5 6 7
xi
94
Ejemplo
Solución
Se traza un eje de coordenadas adecuado a los datos, en el eje “x” estarán los puntos medios y en
el eje “y” las frecuencias acumuladas; se escribe la escala en cada eje y se rotulan con los nombres
de las variables, en este caso
f 55con “xi” y “f a” :
50
45
55
f
40
50
35
45
30
40
25
35
20
30
15
25
10
20
5
15
0
10 5 10 15 20 25 30 35 40 45 50 55 60 65 70
5
xi
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70
xi
Luego se localizan los pares ordenados (xi, f a), y se unen con segmentos de línea:
f 50
40
f 50
30
40
20
30
10
20
0
10 5 10 15 20 25 30 35 40 45 50 55 60 65 70
0 xi
5 10 15 20 25 30 35 40 45 50 55 60 65 70
xi
95
f 50
Se agrega un punto más con40 frecuencia cero, antes de los datos dados, en este caso en el valor 35,
f 50
con el fin de indicar que en ese valor no hay datos, quedando lo siguiente:
30
40
20
30
f 50
10
20
40
0
10
30 5 10 15 20 25 30 35 40 45 50 55 60 65 70
200 xi
5 10 15 20 25 30 35 40 45 50 55 60 65 70
10 xi
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70
xi
Frecuencias acumuladas
f 50
Frecuencias acumuladas
f 40
50
30
40
Frecuencias acumuladas
20
30
f 50
10
20
40
0
10
30 35 40 45 50 55 60 65 70
0 x
20 35 40 45 50 55 60 65 70 i
10 xi
De manera similar al polígono 0 de frecuencias y del histograma, aquí también se pueden utilizar
frecuencias relativas y porcentuales 35
para40elaborar
45 50 la55 60 Para
ojiva. 65 70
esto se utilizan las columnas de la
xi
frecuencia relativa acumulada o la columna de la frecuencia porcentual acumulada.
96
Para las ojivas usando la frecuencia relativa acumulada y la frecuencia porcentual acumulada se
tiene:
Frecuencias acumuladas Frecuencias acumuladas
f 1 f 100
0,9 90
0,8 80
0,7 70
0,6 Frecuencias acumuladas 60 Frecuencias acumuladas
0,5 50
0,4 40
f 0,3 30
f 100
1
0,2 20
0,9 90
0,1 10
80
0,8 0
0,7 70 0
35 40 45 50 55 60 65 70 60 35 40 45 50 55 60 65 70
0,6
0,5 xi 50 xi
0,4 40
0,3 30
0,2 20
0,1
3.6.4 Gráfico circular 10
0 0
35 40 45 50 55 60 65 70 35 40 45 50 55 60 65 70
El gráfico circular es otra manera de25%hacer la
xi representación
35% gráfica de los datos. También xes llamado
Perro i
gráfica de pastel. A diferencia de los gráficos anteriores, en el gráfico
Pájaro circular sólo se representan datos
de frecuencias relativas o frecuencias porcentuales. Hámster
Gato
20%
20%
25% 35% Perro
Pájaro
Hámster
Gato
20%
20%
Para trazar esta clase de gráfico, se debe dividir el área del círculo de manera proporcional a las frecuen
cias. Para construirla fácilmente, se le agrega a la tabla de frecuencias una nueva columna correspon
diente a la proporción de círculo, multiplicando la frecuencia relativa por 360º; posteriormente con la
ayuda de un transportador se hacen las divisiones del círculo.
97
Ejemplo
1 38 - 42 40 3 0.06 6
2 43 - 47 45 7 0.14 14
3 48 - 52 50 17 0.34 34
4 53 - 57 55 13 0.26 26
5 58 - 62 60 6 0.12 12
6 63 - 67 65 4 0.08 8
Solución
1 38 - 42 40 3 0.06 6 21.6°
2 43 - 47 45 7 0.14 14 50.4°
3 48 - 52 50 17 0.34 34 122.4°
4 53 - 57 55 13 0.26 26 93.6°
5 58 - 62 60 6 0.12 12 43.2°
6 63 - 67 65 4 0.08 8 28.8°
98
Se dibuja un radio que servirá para trazar la porción de círculo correspondiente al primer intervalo:
Con la ayuda de un transportador se mide el primer ángulo a partir del radio de referencia, en este
caso de 21.6°, y se traza un segundo radio, quedando así la porción de círculo correspondiente
al primer intervalo; se escribe el porcentaje correspondiente y la marca de clase (punto medio):
4040
6%6%
40
6%
45
14%
5555
26%
26% 6060
12%
12%
55
Se continúa de la misma manera para26% los demás intervalos,
60 cuidando 6565
12% 8%8%
de escribir cada vez el porcentaje y la marca de clase: 4040
65 6%6%
8%
40 5050 4545
6% 34%
34% 14%
14%
50 45
34% 14%
99
Gráfico
Gráficocircular
circular
5555
Gráfico circular 26%
26% 6060
12%
12%
55
CURSO [Link] 99
26% 60 6565
19/11/13 12:25
12%
55
26% 60
12%
65
8%
40
6%
Etapa 3 50 45
34% 14%
65
8%
40
6%
50
34% 45
14%
Algunas ocasiones se trazan los gráficos circulares empleando las frecuencias relativas; en este
caso en lugar de poner los porcentajes se escriben las frecuencias relativas, tal como se muestra en
la siguiente figura:
Gráfico circular
Gráfico
55 circular
0.26 60
55 0.12
0.26 60
0.12
65
0.08
65
0.08
40
0.06
40
0.06
50
45
50 0.34 0.14
0.34 45
0.14
Una variante de esta clase de gráfica es dibujarla a manera de una “moneda” para que adquiera
la forma de pastel. Esto puede lograrse fácilmente utilizando algún programa de computadora.
55 60
55 26% 60 12%
26% 12% 65
8%
65
8%
40
6%
40
50 45 6%
14%
50 34% 45
34% 14%
Con el uso de las computadoras es ahora muy sencillo hacer un gráfico circular; es muy probable
que ya hayas realizado algunos empleando
8 algún programa como lo es el Excel. Esta clase de
programas permite realizar gráficos
8 7 de diferentes tipos, con una gran variedad de formatos, en los
7 6
que se puede incluir colores, cambios de tipo de letra, e incluso modificar la figura a fin de que
frecuencia
absoluta
4
absoluta
5
4 3
100 3 2
2 1
1 0
Perro Pájaro Hámster Gato
0
Perro PájaroMascota
Hámster Gato
Mascota
CURSO [Link] 100 19/11/13 12:25
Gráfico circular
55
0.26 60
0.12
65
0.08
55 60
26% 12%
3.6.5 Otros gráficos 65
8%
Otras clases de gráficas que también se utilizan, son la gráfica de barras y el pictograma.
La gráfica de barras se traza de manera similar al histograma, sólo que6% 40las barras se dibujan separadas
unas de otras. En esta clase de gráfica,
50
la escala en el eje x es para
45mostrar categoría o intervalos de nú
meros no consecutivos. 34% 14%
Ejemplo:
Gráfica de barras
8
7
6
frecuencia
absoluta
5
4
3
2
1
0
Perro Pájaro Hámster Gato
Mascota
En el caso del pictograma, su trazo es similar al de barra, sólo que se sustituyen las barras por figuras,
generalmente relacionadas con la variable estudiada.
Ejemplo:
Pictograma
Altura
en dm
15
10
Niñas Niños
101
Ejercicios
1. Se elaboró una encuesta en un jardín de niños, sobre las mascotas más comunes que tienen,
y se encontró la siguiente información:
2, 3, 4, 6, 3, 4, 5, 3, 4, 4, 6, 2, 6, 1, 7, 3, 5, 4, 4, 3.
3. Elabora una tabla de frecuencias y un histograma para datos agrupados con la siguiente in
formación, agrupando la información en cuatro intervalos.
102
Elabora dos histogramas que muestren, uno, las frecuencias de los datos y el otro, el porcen
taje de los datos.
5. Prueba que el área total que encierra un polígono de frecuencias es igual al área total de los
rectángulos de un histograma.
6. Supón que haces una encuesta en donde le preguntas a 500 personas sobre el número de días
que fuman a la semana; encuentras lo siguiente:
70 personas no fuman
170 personas fuman 1 día
140 2
42 3
30 4
25 5
18 6
5 7
Elabora dos histogramas que muestren, uno, las frecuencias de los datos y el otro, el porcen
taje de los datos.
103
8. Se realizó una encuesta a 50 alumnos del 4° semestre de la prepa para conocer la facultad a
la que piensan inscribirse, encontrándose lo siguiente:
Carrera Alumnos
Medicina 8
Mecánica 11
Civil 8
Agronomía 3
Físico – Matemáticas 3
Leyes 6
Facpya 11
Color Conteo
Azul ||||| |||
Beige ||||| |
Blanco ||||| ||
Café ||||
Gris ||||| ||
Negro |||||
Rosa ||||| |||||
Verde |||
104
11. El maestro de matemáticas quiere ahora analizar las calificaciones obtenidas por el grupo en
el examen indicativo. Pero ahora quiere que se haga un histograma y una ojiva. Da de refe
rencia el último intervalo: 90 – 100, y las calificaciones del grupo son:
50 72 86 62 24 64 62 64 82 80
60 66 54 44 50 64 62 60 50 84
60 72 82 60 72 74 28 68 90 32
34 88 82 40 90 25 68 70 68 100
12. A partir de la siguiente información sobre las tallas de ropa elabora un histograma.
Talla Frecuencia
4 15
6 12
8 10
10 12
12 6
Total
13. La siguiente tabla muestra el número de habitantes, en el año 1873 y en 2005, de los municipios
del área metropolitana de Monterrey y el resto de los municipios del estado de Nuevo León. Elabora
una tabla de frecuencias para cada año. Traza un histograma y un gráfico circular para cada año.
Fuente: Anuario Estadístico 2008 INEGI. NL; Algunos apuntes y datos estadísticos … de J. Eleuterio González, 1873
105
14. La siguiente información corresponde a los coeficientes intelectuales (C.I.) de 100 alumnos elegi
dos al azar de la preparatoria. Elabora una ojiva considerando como primer intervalo el 80 – 84.
Elabora una gráfica de barras y una de línea para mostrar gráficamente la manera en que ha
cambiado el número de personas que mueven la economía del país.
La fotosíntesis es el proceso bioquímico más importante pues con ella la energía luminosa
proveniente del sol se transforma en energía química necesaria para la vida, se libera oxígeno,
usado en la respiración, además de ocurrir la síntesis de materia orgánica a partir de materia
inorgánica, por lo que la vida existente en la Tierra depende principalmente de la fotosíntesis.
106
40 50
30 40
20 30
10 20
10
1960
1970
1980
1990
2000
1960
1970
1980
1990
2000
Años
Años
Aproximadamente, ¿cuántas personas murieron en 1985?
18. La siguiente gráfica representa el consumo de distintos tipos de carnes en un pequeño pobla
do durante el periodo 1984 – 2000.
Pollo
Cosumo en toneladas
Res
10 Pollo
Cerdo
toneladas
Res
10
Cosumo en(miles)
Cerdo
(miles)
5
5
19. De acuerdo a los datos estadísticos del estado de Nuevo León, el 71% de los habitantes están
protegidos por el Seguro Social, el ISSSTE o algún otro seguro público. El 29% no son dere
chohabientes y son atendidos por la Secretaría de Salud Estatal. Elabora un gráfico circular
que muestre la información anterior.
20. La siguiente información corresponde a las causas de muerte en Nuevo León y en el país.
108
21. Los siguientes datos corresponden a la población del país cada diez años desde 1930 y con
estimaciones para los años 2010, 2020 y 2030, distribuida en tres grandes grupos.
22. Las siguientes pirámides poblacionales corresponden a la población en el país en los años
1940, 1960, 1980 y 2000. En las gráficas puede identificarse el número de hombres y de mu
jeres para cada uno de los grupos de edades en que se ha dividido a la población.
Edad Edad
85 y más 0.02 0.02 85 y más 0.06 0.07
80-84 0.03 0.03 1940 80-84 0.05 0.07 1960
75-79 0.04 0.04 75-79 0.09 0.10
70-74 0.08 0.08 70-74 0.16 0.17
65-69 0.11 0.12 65-69 0.20 0.21
60-64 0.20 0.21 60-64 0.37 0.37
55-59 0.21 0.22 55-59 0.41 0.39
50-54 0.28 0.32 50-54 0.53 0.54
45-49 0.36 0.40 45-49 0.61 0.62
40-44 0.45 0.49 40-44 0.67 0.69
35-39 0.67 0.70 35-39 0.96 0.96
30-34 0.63 0.68 30-34 1.01 1.04
25-29 0.75 0.84 25-29 1.20 1.31
20-24 0.74 0.81 20-24 1.40 1.54
15-19 0.97 1.03 15-19 1.74 1.80
10-14 1.25 1.16 10-14 2.23 2.12
5-9 1.44 1.39 5-9 2.71 2.61
0-4 1.45 1.42 0-4 2.94 2.84
6 5 4 3 2 1 0 1 2 3 4 5 6 6 5 4 3 2 1 0 1 2 3 4 5 6
Millones de habitantes Millones de habitantes
109
Edad Edad
85 y más 0.09 0.12 85 y más 0.21 0.29
80-84 0.13 0.16 1980 80-84 0.22 0.27 2000
75-79 0.23 0.25 75-79 0.41 0.45
70-74 0.34 0.37 70-74 0.59 0.66
65-69 0.42 0.46 65-69 0.78 0.88
60-64 0.54 0.57 60-64 1.05 1.15
55-59 0.73 0.73 55-59 1.23 1.33
50-54 0.91 0.95 50-54 1.62 1.73
45-49 1.13 1.18 45-49 1.96 2.11
40-44 1.36 1.39 40-44 2.49 2.70
35-39 1.66 1.74 35-39 3.02 3.33
30-34 1.89 1.95 30-34 3.38 3.75
25-29 2.33 2.48 25-29 3.86 4.30
20-24 2.97 3.18 20-24 4.30 4.77
15-19 3.77 3.89 15-19 4.91 5.08
10-14 4.57 4.52 10-14 5.44 5.30
5-9 5.17 5.11 5-9 5.68 5.54
0-4 4.70 4.65 0-4 5.40 5.23
6 5 4 3 2 1 0 1 2 3 4 5 6 6 5 4 3 2 1 0 1 2 3 4 5 6
Millones de habitantes Millones de habitantes
a) El grupo 0–4 del año 1940, ¿a qué grupo corresponde en el año 1960?
b) De acuerdo a la gráfica del año 2000, ¿en qué grupos de edades hay más mujeres que
hombres?
c) ¿A partir de qué año se presenta un cambio en la forma de la base de la pirámide? ¿Cuáles
crees sean las razones de dicho cambio?
d) Determina el porcentaje que representa el grupo 85 y más respecto al total de la población
en cada pirámide. ¿Existe algún cambio?
23. La siguiente tabla muestra la población del país en algunos años a partir de 1790. Los datos
de 2010 son estimados. Podrás notar que la población pasó de poco más de 6 millones en
1810, a 15 millones en 1910 y para este año 2010 se estima en alrededor de 111 millones.
110
24. La siguiente tabla muestra el número de automóviles que han circulado y que circulan en el
país en diferentes años.
25. La siguiente tabla muestra la producción petrolera en el país. Los datos se refieren a petróleo
crudo en miles de barriles.
111
4.1.1 Moda
La moda es el valor que se repite con mayor frecuencia en un conjunto de datos. Puede no existir, o
bien, en caso de existir, puede haber uno o más valores que representen a la moda.
113
8
7
6
frecuencia
absoluta
5
4
3
2
1
0
Perro Pájaro Hámster Gato
Mascota
5
En los datos 2, 3, 3, 3, 3, 4, 5, 6,46, 7, 8, 8, 8, 8, 9, 9 hay dos modas, el 3 y el 8; en este caso se dice que
es bimodal. % f 340
35
230
En caso de existir más de dos modas 125 se dice que el conjunto es multimodal.
020
15 Perro Pájaro Hámster Gato
10 Mascota
En las graficas de frecuencias, la moda
5 se identifica con la parte más alta del polígono o con la barra
más alta del histograma. 0
35 40 45 50 55 60 65 70
En la siguiente figura la moda es 50. xi
Histograma
% f 40
35
30
25
20
15
10
5
0
35 40 45 50 55 60 65 70
xi
114
En la siguiente figura los valores 45 y 60 son la moda; en este caso el conjunto es bimodal:
Histograma
Histograma
f 20
f 20
15
15
10
10
5
5
0
0
35 40 45 50 55 60 65 70
35 40 45 50 55 60 65 70
xi
xi
En el siguiente polígono se puede observar que los valores 45 y 65 son las modas:
Histograma
Histograma
f 20
f 20
15
15
10
10
5
5
0
0
35 40 45 50 55 60 65 70
35 40 45 50 55 60 65 70
xi
xi
Color Conteo f fr %f
Azul ||||| ||| 8 0.16 16
Beige ||||| | 6 0.12 12
Blanco ||||| || 7 0.14 14
Café |||| 4 0.08 8
Gris ||||| || 7 0.14 14
Negro ||||| 5 0.10 10
Rosa ||||| ||||| 10 0.20 20
Verde ||| 3 0.06 6
Total 50 1.00 100
Puede identificarse que la moda es el color rosa, con una frecuencia del 20%.
4.1.2 Mediana
La mediana es el valor que se ubica a la mitad de los datos cuantitativos cuando éstos han sido orde
nados en forma ascendente. No necesariamente es un valor observado.
115
Por ejemplo:
La mediana de 21, 23, 24, 24, 25, 26, 28, 29, 30, es 25.
Para el caso de tener un tamaño “n” par, la mediana es el promedio de los dos datos que se encuentran
a la mitad de la lista ordenada.
Por ejemplo:
La mediana de 21, 21, 23, 24, 24, 25, 26, 28, 29, 30, es 24.5.
Ejemplo
Solución
Dado que se tienen 50 datos, la mediana estaría ubicada entre los datos 25 y 26, de tal manera
que si se ordenaran en forma ascendente esa posición se ubicaría en el tercer intervalo, por lo que
el valor que representa a la mediana es 50.
116
Otra forma para encontrar un valor que represente a la mediana de datos agrupados es partir del
supuesto de que la mediana se encuentra mediante la siguiente fórmula:
n –f
Mediana 5 Li 1 (
2 i–1
fi
)
(tamaño de invervalo).
Ejemplo
Solución
Dado que se tienen 50 datos, la mediana estaría ubicada entre los datos 25 y 26, de tal manera
que si se ordenaran en forma ascendente esa posición se ubicaría en el tercer intervalo.
50 – 10
Mediana 5 (48) 1 ( 2
17
(4) )
Mediana 5 51.53
117
Un supuesto más que se puede emplear para determinar un valor que represente la mediana es
considerar que dentro del intervalo en que se encuentra la mediana todas las observaciones (da
tos) se encuentran a la misma distancia una de otra dentro del intervalo, esto es, se distribuyen
de manera uniforme.
Ejemplo
Solución
Si los datos se distribuyen de manera uniforme dentro de ese intervalo, entonces habría una dis
tancia de 4/17 entre cada dato.
Si se ordenan los datos se tendría que entre los datos 25 y 26 estaría la mediana.
Dentro del intervalo que contiene a la mediana correspondería a la posición entre 15 y 16.
Por lo tanto se tiene que a una distancia de (15.5)(4/17) 5 3.65 del límite inferior se encontraría
la mediana.
Al sumar esa distancia al límite inferior del intervalo se tiene: 48 1 3.65 5 51.65
Sin embargo, es de aclarar que estos procedimientos sólo son maneras de encontrar un valor que
represente a la mediana. En algunos casos puede coincidir con el valor real de la mediana, en
otros, sólo se aproxima.
118
Si se revisan los datos originales del ejemplo, puede observarse que la mediana es 52.
39 40 42 43 44 44 45 46 46 47
48 48 48 49 49 50 50 50 50 51
51 51 51 51 52 52 52 53 53 54
54 55 55 55 56 56 56 56 56 57
58 59 59 60 61 62 63 63 64 66
4.1.4 Media
La media, también conocida como media aritmética o promedio se le define como la suma de todas
las observaciones, de datos cuantitativos, dividida entre el número total de observaciones.
Se representa con la letra “µ” o con el símbolo “x”; la primera es para representar la media de una po
blación y la segunda para representar la media de una muestra de la población.
La media de una población, “µ”, y la media de una muestra, “x”, se obtiene de la misma manera, sumando
n
∑x i
todos los datos (valores) y dividiendo entre el total de datos mediante la siguiente fórmula: x i =1 .
n
Ejemplo
Solución
n
∑x
i 1
i
23 1 24 1 24 1 25 1 26 1 28 150
x 5 5 5 25
n 6 6
x 5 25 n
∑fx
i 1
i i
Si los datos proceden de una tabla de frecuencias entonces la fórmula es: x .
n
Nota que en este caso se deben considerar las frecuencias con las que se repite cada valor.
119
Ejemplo
xi f
48 3
49 2
50 5
52 10
54 6
55 4
Total 30
Solución
Observa que el valor 48 aparece tres veces, el 49, dos veces, el 50, cinco veces, y así los demás
valores; por ello para calcular la media de los datos de la tabla de frecuencias, y de acuerdo a la
fórmula, es conveniente agregar una nueva columna a la tabla de frecuencias con la multiplica
ción “fi ? xi”:
Tabla de frecuencias
xi f fi xi
48 3 144
49 2 98
50 5 250
52 10 520
54 6 324
55 4 220
Total 30 1 556
La media es: n
∑fx
i 1
i i
1 556
x 5 5 51.87
n 30
x 5 51.87
120
Para calcular la media a partir de datos de una tabla de frecuencias de datos agrupados la fórmula es:
n
∑ f pm i i
x
i 1
. El procedimiento es similar al anterior, pues hay que agregar la columna de la multiplica
n
ción de fi ? pmi, donde pmi o xi es el punto medio del intervalo de clase.
Ejemplo:
La media es:
n n
∑ f pm
i 1
i i ∑fx i i
2620
i 1
x 5 5 5 52.4
n n 50
x 5 52.4
Encontrar la media mediante el uso de un programa de computadora resulta muy sencillo, aunque
para esto debe tenerse capturadas todas las observaciones, pues sólo hay que introducir la fórmula para
el promedio o bien dar la instrucción para la operación. Se te recomienda practicar su uso tanto de
manera manual, usando la calculadora y comprobar con algún programa de computación.
121
Ahora bien, se debe recordar que las tres medidas de tendencia central se pueden determinar para un
conjunto de datos cuantitativos; para datos cualitativos sólo se puede determinar la moda. Observa los
siguientes ejemplos:
Intervalo Intervalo
“xi” f “xi” f fxi
de clase de clase
4.5-5.5 5 3 Se agrega una nueva 4.5-5.5 5 3 15
5.5-6.5 6 8 columna con la 5.5-6.5 6 8 48
multiplicación “fi ? xi”
6.5-7.5 7 12 6.5-7.5 7 12 84
7.5-8.5 8 15 7.5-8.5 8 15 120
8.5-9.5 9 8 8.5-9.5 9 8 72
9.5-10.5 10 4 9.5-10.5 10 4 40
Total 50 Total 50 379
∑fx
i 1
i i
379
La media es: x 5 5 7.58
n 50
Nuevamente, determina la moda, mediana y media del siguiente conjunto de datos que corres
ponden a las tallas de ropa que hay en una boutique:
Observa que se puede agregar una nueva columna con la multiplicación “Talla ? xi,”, sin embargo
no tiene sentido dicho valor.
122
La moda es talla 8, o talla Grande, ya que es la clase que tiene mayor frecuencia.
Nota que aún y cuando son los mismos valores que el problema anterior no tiene sentido
hablar de una mediana igual a 7.6 o una media de 7.58, pues estos valores no corresponden
a ninguna de las tallas.
Ejercicios
1. Encuentra la media de los siguientes datos:
6.4, 6.5, 6.7, 6.7, 6.8, 6.8, 6.9, 7.0, 7.0, 7.1.
3. Con los siguientes datos elabora una tabla de frecuencias, un histograma, un polígono de
frecuencias. Encuentra el valor de la media, mediana y moda:
20, 21, 22, 26, 25, 23, 24, 20, 20, 21, 22, 25, 23, 24, 21, 21, 25,
23, 22, 22, 25, 26, 26, 26, 25, 26.
a) Ordénalos.
60, 70, 75, 83, 87, 90, 98, 61, 66, 74, 75, 81, 87, 91,
97, 63, 65, 70, 79, 80, 86, 90, 95, 63, 66, 74, 77, 81,
86, 92, 95, 60, 66, 71, 76, 80, 63, 69, 74, 75, 81, 85,
90, 64, 69, 73, 77, 84, 87, 91, 60, 65, 71, 77, 84, 73,
78, 84, 75, 81, 75, 82, 78, 81, 75, 82, 79, 77, 78, 100.
123
Calificación 5 6 7 8 9 10
Frecuencia 3 5 17 9 5 3
Elabora una tabla de frecuencias completa, un polígono de frecuencias, una ojiva y determi
na la media.
124
8. Se aplicó un examen de 40 preguntas a 300 alumnos obteniéndose los siguientes resultados:
Calificación Frecuencia
1 1
2 2
3 4
4 6
5 8
6 12
7 15
8 12
9 7
10 3
a) Elabora un histograma.
b) Determina las tres medidas de tendencia central.
c) Señala la media, mediana y moda en la gráfica.
125
10.
De nuevo se aplicó un examen a otro grupo de 70 alumnos y se obtuvieron los siguientes datos:
Calificación Frecuencia
1 3
2 7
3 12
4 15
5 12
6 8
7 6
8 4
9 2
10 1
a) Elabora un histograma.
b) Determina las tres medidas de tendencia central.
c) Señala la media, mediana y moda en la gráfica.
11. Los siguientes histogramas representan las calificaciones de los alumnos de cuatro grupos. Las
calificaciones van desde 0 hasta 10, en donde la primera barra representa una calificación de
cero y la última una calificación de diez:
A B C D
126
Para entender su importancia imagina que requieres para cierta actividad objetos con una media igual a
10, y hay dos proveedores, el A y el B, que te ofrecen el producto que deseas con media igual a 10.
Los proveedores te envían una muestra con cinco objetos cada uno, los cuales se representan como
conjuntos en las siguientes figuras:
A B
5 9
15 11
10 8 10.5 10
12 9.5
Si calculas la media en cada conjunto, podrás notar que la media en el conjunto A es 10; la media en
el conjunto B también es 10.
Si estuvieras interesado en conseguir el producto con una media igual a 10, ¿con cuál de los conjuntos
te quedarías?
Observarás que en el conjunto A, los datos varían de 5 hasta 15, en cambio en el conjunto B, son desde
9 hasta 11.
Se puede notar que en el conjunto B todos sus datos están muy cerca de la media, en cambio en el
conjunto A, algunos de ellos están muy alejados de la media. Es decir, los datos del conjunto B son más
homogéneos que en el otro conjunto; en el conjunto A son muy heterogéneos.
Si sólo dispones de la media como medio de información podrías escoger al proveedor equivocado.
Esto significa que, además de la media, se vuelve necesario tener otro indicador que muestre la medida en
que varían los datos. La opción es tener una medida de la variación de los datos respecto a su media.
Las medidas de variación más usuales en estadística son el rango, la varianza, la desviación estándar
y el coeficiente de variación.
4.2.1 Rango
El rango, también llamado recorrido, muestra la amplitud de los datos y se obtiene mediante la dife
rencia entre el valor mayor y el valor menor de los datos. Se representa con la letra R (no debe confun
dirse con el rango de una función).
127
Ejemplo
Determina el rango de los datos 21, 21, 23, 24, 24, 25, 26, 28, 29, 30.
Solución
R 5 30 – 21 5 9
El rango es 9.
Observa que el rango es la distancia que hay entre los dos valores extremos del conjunto de datos.
Para calcularlo es conveniente tener los datos en forma ordenada.
Ejemplo:
Considerando el conjunto A, cuyos elementos son 5, 8, 10, 12 y 15, y con media igual a 10.
Determina los desvíos de cada uno de los datos respecto a la media:
xi (xi – x)
5 –5
8 –2
10 0
12 2
15 5
Puede observarse que el dato 5 tiene una desviación de –5 respecto a la media; el dato 12, tiene
una desviación de 2; en cambio el dato 10 tiene una desviación de 0. Esto significa que el desvío
puede tener valores positivos, negativos e incluso puede ser cero.
También se puede notar que al sumar los desvíos, la suma siempre dará cero.
∑x
i 1
i
–x
DM
n
128
Sin embargo, la medida de variación más usual en los trabajos de investigación científica es la varianza;
en ella se trata de representar la variación, empleando para ello los desvíos al cuadrado.
4.2.4 Varianza
La varianza de un conjunto de datos es un estadístico que representa la variación que tienen los datos
respecto a la media. Se representa con s2, si se trata de la varianza de una muestra o con s2, si es la
varianza de la población.
∑ (x
i 1
i
– )2
2
N
Para calcular la varianza de datos de una muestra representativa de la población se usa la siguiente
fórmula:
n n
∑ (x
i 1
i
– x )2 ∑ (x )
i 1
i
2
– n(x )2
s2 , o bien su equivalente: s2 .
n –1 n –1
Si se debe calcular la varianza a partir de una tabla de frecuencias, se utiliza la siguiente fórmula:
n n
∑ f (x
i 1
i i
– x )2 ∑ f (x )
i 1
i i
2
– n(x )2
s2 , o bien su equivalente: s2 .
n –1 n –1
Para el cálculo de la varianza poblacional, en la fórmula, aparece la división entre “N”; en cambio
en la varianza muestral se divide entre “n – 1”. La razón de esto la encontrarás en tus cursos pos
teriores de estadística, o bien puedes consultar el término “grados de libertad”.
Ejemplo 1
Determina el valor de la varianza del conjunto: 21, 21, 23, 24, 24, 25, 26, 28, 29, 30, cuya media
es 25.1.
Solución
∑ (x
i 1
i
– x )2
s2
n –1
(21 – 25.1)2 1 (21 – 25.1)2 1 …(30 – 25.1)2
s2 5
10 – 1
129
88.9
s2 5
9
s2 5 9.87
Ejemplo 2
Solución
1. Se calcula la media:
130
∑ f (x
i 1
i i
– x )2
2 012
s2 5
n –1 50 – 1
s2 5 41.06
Ejemplo 3
Considera que los siguientes datos corresponden a una población. Determina la varianza.
30 - 35 32.5 4
35 - 40 37.5 5
40 - 45 42.5 8
45 - 50 47.5 10
50 - 55 52.5 20
55 - 60 57.5 19
60 - 65 62.5 4
131
Solución
∑ f (x
i 1
i i
– )2
4 328.4
2 5
N 70
s2 5 61.83
Encontrar la varianza mediante el uso de un programa de computadora resulta muy sencillo, aunque
para esto debe tenerse capturadas todas las observaciones, pues sólo hay que introducir la fórmula
para la varianza o bien dar la instrucción para la operación. Se te recomienda practicar su uso tanto
de manera manual, usando la calculadora y comprobar con algún programa de computación.
132
Se representa con “s”, si es la varianza de la población, o con “s”, si se trata de la varianza de una
muestra de la población.
s 5 s2
Y para calcular la desviación estándar de la muestra de una población se utiliza la siguiente fórmula:
s 5 s2
(x i – x )2
s5
n –1
Ejemplo
Solución
La desviación es:
s5 41.06
s 5 6.408
133
Ejemplo 1
Se realiza un estudio con atletas para investigar la relación entre la cadencia del ejercicio y la fre
cuencia cardiaca. Se midió la frecuencia cardiaca de 20 personas con una cadencia de 48 ciclos
(un ciclo son dos pasos) y se encontraron los siguientes datos:
87, 109, 79, 80, 96, 95, 90, 92, 96, 98, 101, 91, 78, 112, 94, 98, 94, 107, 81, 96.
Elabora un histograma y una ojiva para datos agrupados, y para datos sin agrupar determina la
media, la desviación estándar y el coeficiente de variación.
Solución
78, 79, 80, 81, 87, 90, 91, 92, 94, 94, 95, 96, 96, 96, 98, 98, 101, 107, 109, 112.
xi f
78 1
79 1
80 1
81 1
87 1
90 1
91 1
92 1
94 2
95 1
96 3
98 2
101 1
107 1
109 1
112 1
Total 20
134
xi f fxi 95 1 95
78 1 78 96 3 288
n
79 1 79 98 2 196 ∑fx
i 1
i i
1 874
80 1 80 101 1 101 x5 5 5 93.7
n 20
81 1 81 107 1 107
x 5 93.7
87 1 87 109 1 109
90 1 90 112 1 112
91 1 91 Total 20 1 874
92 1 92
94 2 188
135
87 1 87 44.89 44.89 ∑ f (x
i 1
i i
– x )2
1 734.2
90 1 90 13.69 13.69 s2 5
n –1 20 – 1
91 1 91 7.29 7.29
s2 5 91.27
92 1 92 2.89 2.89
94 2 188 0.09 0.18
95 1 95 1.69 1.69
96 3 288 5.29 15.87
98 2 196 18.49 36.98
101 1 101 53.29 53.29
107 1 107 176.89 176.89
109 1 109 234.09 234.09
112 1 112 334.89 334.89
Total 20 1 874 1 734.20
Desviación estándar:
s 5 s2
s5 91.27
s 5 9.55
Coeficiente de variación:
s
CV 5 (100)
x
9.55
CV 5 (100)
37.5
CV 5 10.2%
136
Ejemplo 2
Imagina que de pronto transcurren cinco años y ya has terminado tu carrera en materia de nego
cios y decides emprender un negocio en el área de alimentos orgánicos y exóticos, pues recuerdas
que dos de tus ex compañeros de prepa, uno que estudió biología y el otro, agronomía, te decían
que ahí estaba el futuro.
Se te ocurre la idea que entre los platillos a ofrecer está uno a base de chapulines. Para ello requie
res que un proveedor te surta chapulines que midan 10 cm de longitud.
Consultas en Internet y encuentras a dos proveedores que aseguran te pueden enviar el producto
solicitado. Les pides una muestra y te envían una muestra con cinco chapulines cada uno, los
cuales se representan como conjuntos en las siguientes figuras:
A B
5 9
15 11
10 8 10.5 10
12 9.5
Otro de tus ex compañeros de prepa, que ahora es tu socio, convirtió los chapulines en números,
pues es matemático, te dice:
Podrás notar que el rango en el conjunto A es de diez unidades, los datos están más separa
dos unos de otros, son muy heterogéneos; mientras que en el conjunto B, el rango es de dos
unidades, los datos están más cerca uno de otros, son más homogéneos.
Para analizar los datos habrá que determinar la media, la desviación estándar y el coeficiente de
variación de los dos conjuntos de datos A y B.
Datos:
Proveedor A: {5, 8, 10, 12, 15} Proveedor B: {9, 9.5, 10, 10.5, 11}
Para el conjunto A:
n
∑x
i 1
i
5 1 8 1 10 1 12 1 15 50
x 5 5 5 10
n 5 5
xA 5 25
137
Para el conjunto B:
n
∑x
i 1
i
9 1 9.5 1 10 1 12 1 15 50
x 5 5 5 10
n 5 5
xB 5 25
Para el conjunto A:
n
∑ (x
i 1
i
– x )2
(5 – 10)2 1 (8 – 10)2 1 (10 – 10)2 1 (12 – 10)2 1 (15 – 10)2
s2 5
n –1 5–1
58
s2 5
4
s2 5 14.5
s 5 3.81
Para el conjunto B:
n
∑ (x
i 1
i
– x )2
(9 – 10)2 1 (9.5 – 10)2 1 (10 – 10)2 1 (10.5 – 10)2 1 (11 – 10)2
s2 5
n –1 5–1
2.5
s2 5
4
s2 5 0.625
s 5 0.79
Para el conjunto A:
s 3.81
CV 5 (100) 5 (100)
x 10
CVA 5 38.1%
Para el conjunto B:
s 0.79
CV 5 (100) 5 (100)
x 10
CVB 5 7.9%
138
Observa que el coeficiente de variación del conjunto A es mucho mayor que el del con
junto B.
Mientras mayor sea el CV, los datos están más alejados de su media, esto es que están
más dispersos; en cambio, mientras menor sea el CV, los datos están más cerca de su
media, esto es, los datos están menos dispersos.
Por lo que se concluye que el producto del proveedor B es más homogéneo, por lo tanto
más idóneo para lo que se pretende realizar.
Ejercicios
1. Calcula la media, varianza y desviación estándar del siguiente conjunto de datos:
4, 2, 0, 9, 4, 2, – 1, 1, – 4, 2.
2. Pregunta las estaturas de tus compañeros. Registra todos estos datos y calcula la media, va
rianza y desviación estándar.
3. Pide a tu maestro de matemáticas los resultados del examen parcial del grupo para que deter
mines la media y la desviación estándar.
4. Escribe las calificaciones de las materias que llevas actualmente y calcula la media, varianza,
desviación estándar y el coeficiente de variación.
5. Calcula la media, varianza, desviación estándar y coeficiente de variación del siguiente con
junto de datos agrupados:
139
7. Se ha medido en 30 personas los niveles de cierta sustancia presente en la sangre, encontrán
dose lo siguiente:
8.4 9.2 9.5 8.8 9.8 8.7 9.2 9.8 9.9 9.8
9.3 9.5 8.5 9.7 8.6 9.6 9.1 10.1 9.2 9.4
8.9 9.5 9.7 9.4 10.2 9.6 8.8 10.0 9.4 8.7
8. Los siguientes datos corresponden a los tiempos registrados después de una carrera en la que
participaron 50 corredores:
20, 27, 31, 40, 26, 56, 36, 19, 36, 35,
48, 54, 38, 10, 28, 13, 46, 10, 31, 37,
30, 59, 43, 53, 25, 39, 42, 31, 24, 33,
25, 17, 34, 31, 27, 41, 63, 32, 41, 38,
52, 50, 15, 49, 34, 44, 24, 47, 21, 22.
140
Frecuencias
Calificación
Grupo A Grupo B
1 1 3
2 2 7
3 4 12
4 6 15
5 8 12
6 12 8
7 15 6
8 12 4
9 7 2
10 3 1
10. Se aplica el mismo examen de 40 preguntas a otros 600 alumnos de dos escuelas, 300 en cada
una, obteniéndose los siguientes resultados:
141
a 1
b 3 1 2
c 5 2 4
d 7 3 6
e 9
Al hacer esto se formaba un nuevo conjunto cuyos elementos eran pares de números, pares ordenados
de números.
Esa asociación de números se representaba mediante una ecuación en dos variables, generalmente
representadas con las letras “x” y “y”. Cuando se conocía el nombre de las variables, las letras podían
cambiarse por aquellas relacionadas por el nombre de la variable; si la variable era tiempo, la “x” podía
sustituirse por “t”, si representaba peso, se sustituía por una “p”, y así por el estilo.
Cuando se hacía la asociación, en algunos casos se mencionaba que una de las variables afectaba el
valor de la otra variable. A esta clase de relación se le llama función.
Hiciste un sinnúmero de ejercicios y en todos los casos partías de una ecuación, definías los valores de
una de las variables y encontrabas los valores de la segunda variable, y posteriormente graficabas. De
esta manera visualizabas funciones lineales, cuadráticas o de otro tipo.
Sin embargo, en la realidad, cuando trabajas variables, te encuentras con conjuntos de datos de varia
bles concentrados en tablas de valores (tablas de frecuencias), como las siguientes:
142
Con los que debes averiguar si existe o no una relación entre las variables, y en caso de existir una
relación entre ellas entonces se debe encontrar una expresión, una ecuación que los represente. El
análisis estadístico entre dos variables se enfoca a determinar el grado de relación que existe entre
ellas y a encontrar una relación adecuada para representarlas, procesos realizados mediante la corre
lación y la regresión.
4.4 Correlación
En las secciones anteriores se trabajaron distribuciones univariadas, esto es, con datos que provenían
de una sola variable; por ejemplo, el peso de las personas de un grupo, o las calificaciones obtenidas
en un examen de matemáticas. Con ellos se elaboraron tablas de frecuencias, se graficaron y se calculó
la media, la desviación estándar y el coeficiente de variación.
Ahora, en esta sección se revisan distribuciones bivariadas, esto es, conjuntos de datos que provienen
de dos variables a la vez. Por ejemplo, una relación bivariada muy común es la relación peso – es
tatura, otra puede ser horas de estudio con calificación obtenida, o el número de días trabajdos y el
salario mensual.
La correlación es una técnica estadística que mide el grado de relación que existe entre dos variables.
Sus valores van de 1 a –1.
Una distribución bivariada puede mostrar tres clases de correlación: correlación positiva, correlación
negativa y correlación cero.
Estas clases de correlación pueden identificarse visualmente al graficar los datos de las dos variables. A
la representación gráfica se le llama diagrama de dispersión.
6 6 6
4 4 4
2 2 2
0 0 0
0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100
xi xi xi
143
En la correlación cero, no se observa relación alguna en el comportamiento de las dos variables, por lo que
se dice que no hay correlación, esto es, no están asociadas, por lo tanto las dos variables son independientes
una de otra. Su valor es cero y significa que no hay asociación entre las variables, son independientes una
de otra.
cov(x, y)
r5
sx sy
∑ (x
i 1
i
– x )(y i – y)
cov(x, y) 5
n
sx es la desviación de la variable x.
sy es la desviación de la variable y.
(x)(y)
–(x)(y)
r n
sx sy
n
Donde: S(x)(y) es x y i i
i 1
x es la media de la variable x.
y es la media de la variable y.
sx es la desviación de la variable x.
sy es la desviación de la variable y.
144
Ejemplo 1
Habilidad numérica
550
500
450
400
350
El diagrama de dispersión muestra que existe una asociación 300
positiva entre la habilidad verbal y la habilidad numérica 250
200
150
100
50
0
0 100 200 300 400 500 600
2. Se calculan las medias de las dos variables:
Habilidad verbal
Puntuaciones en examen
de selección
Habilidad Habilidad
n
Alumno verbal numérica
“x” “y” ∑x
i 1
i
3 600
x
1 350 350 n
5 8 5 450
2 360 480 n
3 400 400 ∑y
i 1
i
3 960
4 410 500 y 5 5 495
n 8
5 450 450
6 500 630
7 550 600
8 580 550
Total 3 600 3 960
145
cov(x, y)
3. Se calcula el coeficiente de correlación usando la fórmula de covarianza r 5 , para ello
sx sy
se determina la covarianza (x,y) y las desviaciones de ambas variables.
Habilidad Habilidad
Alumno verbal numérica (xi – x)(yi – y) (xi – x)2 (yi – y)2
“x” “y”
1 350 350 14 500 10 000 21 025
2 360 480 1 350 8 100 225
3 400 400 4 750 2 500 9 025
4 410 500 –200 1 600 25
5 450 450 0 0 2 025
6 500 630 6 750 2 500 18 225
7 550 600 10 500 10 000 11 025
8 580 550 7 150 16 900 3 025
Total 3 600 3 960 44 800 51 600 64 600
Covarianza:
n
∑ (x
i 1
i
– x )(y i – y)
44 800
cov(x,y) 5 5 5 5 600
n 8
Desviaciones:
n
∑ (x
i 1
i
– x )2
51 600
sx2 5 5 6 450
n 8
sx 5 80.3
∑ (y
i 1
i
– y)2
64 600
sy2 5 5 8 075
n 8
sy 5 89.86
Correlación:
cov(x, y) 5 600
r5 5 5 0.77
sx sy (80.3)(89.86)
El valor indica una correlación o asociación positiva entre la habilidad verbal y la habilidad
numérica, lo que indica que la habilidad verbal favorece a la habilidad numérica y viceversa.
146
Habilidad Habilidad
Alumno verbal numérica (x)(y) (xi – x)2 (yi – y)2
“x” “y”
1 350 350 122 500 10 000 21 025
2 360 480 172 800 8 100 225
3 400 400 160 000 2 500 9 025
4 410 500 205 000 1 600 25
5 450 450 202 500 0 2 025
6 500 630 315 000 2 500 18 225
7 550 600 330 000 10 000 11 025
8 580 550 319 000 16 900 3 025
Total 3 600 3 960 1 826 800 51 600 64 600
Desviaciones:
n
∑ (x
i 1
i
– x )2
51 600
sx2 5 5 6 450
n 8
sx 5 80.3
∑ (y
i 1
i
– y)2
64 600
sy2 5 5 8 075
n 8
sy 5 89.86
Correlación:
(x)(y) 1 826 800 – (450)(495)
–(x)(y)
n 8 5 600
r 5 5 5 0.77
sx sy (80.3)(89.86) (80.3)(89.86)
147
Ejercicios
1. Se hizo un estudio sobre el comportamiento del nivel de ventas cuando se modifica el precio
de venta.
a) Identifica mediante una gráfica, si existe alguna asociación entre ambas variables.
b) Determina el grado de asociación que existe entre ellas.
2. Se registró la cantidad de discos compactos (CD) que se han producido en el periodo de 1985
a 1992.
148
Puntuaciones en examen
de selección
Habilidad Habilidad
Alumno
verbal numérica
1 250 280
2 280 300
3 300 300
4 310 400
5 350 350
6 400 530
7 450 400
8 480 480
a)
Identifica visualmente, mediante una gráfica, si existe alguna asociación entre ambas va
riables.
b) Determina el grado de asociación que existe entre ellas.
4. En los últimos años una empresa ha estado realizando gastos en publicidad, pero se desconoce
si esto tiene algún beneficio para la empresa. Dado lo anterior se decide averiguar si es posible
que existe o no alguna relación entre los gastos de publicidad y las utilidades de la empresa. Al
revisar los informes de la empresa se determina lo siguiente:
149
5. Se quiere determinar si existe o no una relación entre la distancia que hay entre el abanico y el
botón de encendido de una PC y número de fallas que se presenta en el encendido.
4.5 Regresión
Cuando se encuentra que dos variables están asociadas, esto es, que tengan una correlación positiva o
negativa, se puede proceder a encontrar una expresión que representa a los datos. La técnica utilizada
para encontrar la ecuación lineal que represente a los datos se le conoce como regresión lineal. La
ecuación o fórmula permite hacer predicciones con las variables de la misma manera en que lo hiciste
cuando llevaste el tema de funciones.
Para encontrar la ecuación de regresión deben de calcularse las constantes a y b, donde a es la intersección
con el eje “y” y b es la pendiente de la recta. Sus valores se determinan mediante las siguientes fórmulas:
150
a 5 y – bx
Ejemplo 1
151
Desviaciones: Medias:
Correlación:
r 5 0.77
Ecuación de regresión:
sy
b 5 r s 5 (0.77)
x
(
89.86
80.3
5 0.86 )
a 5 y – bx 5 495 – (0.86)(450) 5 108
y 5 a 1 bx 5 108 1 0.86x
Ejercicios
Con base en los ejercicios de la sección de correlación encuentra la ecuación de regresión
para cada caso.
1. S e está haciendo un estudio sobre el comportamiento del nivel de ventas cuando se modifica
el precio de venta. Se encuentra lo siguiente:
152
2. Se registró la cantidad de discos compactos “CD” que se han producido en el periodo de 1985
a 1992.
3.
Se aplicó un examen de habilidades verbales y matemáticas a 8 estudiantes de la prepa, con el
fin de determinar si existe o no asociación entre ambas habilidades. Los resultados se muestran
en la tabla de datos.
Determina la ecuación de regresión que relaciona la habilidad verbal con la habilidad mate
mática.
153
4. En los últimos años una empresa ha estado realizando gastos en publicidad, pero se desconoce
si esto tiene algún beneficio para la empresa. Dado lo anterior se decide averiguar si es posible
que existe o no alguna relación entre los gastos de publicidad y las utilidades de la empresa. Al
revisar los informes de la empresa se encuentra lo siguiente:
Determina si existe o no una relación entre las variables. En caso de existir, calcula una ecua
ción para representar el comportamiento entre gastos de publicidad y la utilidad.
5. Se quiere determinar una ecuación que represente la relación entre la distancia que hay entre
el abanico y el botón de encendido de una PC y número de fallas que se presenta en el encen
dido. A partir de la siguiente información, resuelve los incisos a y b.
a) Grafica la información.
b) Calcula una ecuación para representar el comportamiento.
154
6. Se realizó un experimento en un cultivo de maíz para determinar el efecto del nitrógeno en el
rendimiento. Para esto se establecieron cuatro dosis diferentes del fertilizante (40, 80, 120 y 160
kg/ha) más el testigo (0 kg/ha) y el rendimiento se midió en kg de producto por hectárea.
a) En caso de existir relación entre los datos, ¿cuál sería la variable independiente y cuál la
variable dependiente?
b) Grafica los datos.
c) Determina una ecuación lineal que represente a los datos.
7.
Después de realizar una serie de experimentos se ha determinado que existe una cierta relación
entre la temperatura y el tiempo de reacción entre dos sustancias. La siguiente tabla de datos
muestra lo obtenido.
Temperatura 20 °C 22 °C 24 °C 26 °C 28 °C 30 °C 32 °C 34 °C
Tiempo de reacción 9.5 min 9.0 min 7.5 min 7.0 min 5.5min 4 min 2.5 min 2.0 min
Mediante la regresión lineal determina una ecuación que represente a la relación entre la tem
peratura y el tiempo de reacción.
155