0% encontró este documento útil (0 votos)
424 vistas95 páginas

Untitled

Este documento presenta información sobre estadística descriptiva. Explica que la estadística descriptiva describe y resume conjuntos de datos, y que tiene como objetivo describir las características fundamentales de los datos mediante medidas como la media y la desviación estándar. También divide la estadística en descriptiva e inferencial, y explica las etapas de la investigación estadística como la recopilación y organización de datos, el análisis e interpretación, y la formulación de conclusiones.

Cargado por

Victor Valles
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
424 vistas95 páginas

Untitled

Este documento presenta información sobre estadística descriptiva. Explica que la estadística descriptiva describe y resume conjuntos de datos, y que tiene como objetivo describir las características fundamentales de los datos mediante medidas como la media y la desviación estándar. También divide la estadística en descriptiva e inferencial, y explica las etapas de la investigación estadística como la recopilación y organización de datos, el análisis e interpretación, y la formulación de conclusiones.

Cargado por

Victor Valles
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA

DESCRIPTIVA
Un enfoque de casos prácticos

11%
12%
9%
10%
7%
8% 6%

6%
3%
4%

2%

0%
America Africa Asia Europa Oceanía

GILBERT CHUA
Docente: Gilbert Chua

PRESENTACIÓN

“Mientras exista inteligencia humana, voluntad y compromiso todo es posible”

La universidad como responsable de cultivar y desarrollar la inteligencia de la


nación, forma científicos, técnicos y dirigentes del más alto nivel, que,
identificados y comprometidos con la sociedad, participaran activamente en su
desarrollo y transformación.

“Educar” decía José Marti, “es depositar en cada hombre toda la obra humana
que le ha antecedido; es hacer a cada hombre resumen del mundo viviente hasta
el día en que vive. Es ponerlo a nivel de su tiempo; con lo que no podrá salir a
flote. Es preparar al hombre para la vida.”

El presente folleto de Estadística Descriptiva ha sido preparado para la todas las


facultades de esta Universidad Nacional de Alto Amazonas de acuerdo al silabo
presentado, para cada carrera.

La finalidad es brindar a los estudiantes conocimientos básicos y aplicados de la


Estadística básica, por ser un instrumento básico que utilizan los empresarios,
profesionales, investigadores para la toma de decisiones en las diferentes áreas
como las finanzas, producción, negocios, industria, la agricultura, y otros.

Este folleto consta de 2 unidades que están bien distribuidos de acuerdo al silabo
actualizado, el primer capitulo consta de estadística descriptiva univariada y la
segunda unidad de probabilidades.

Finalmente, a los jóvenes y a la inteligencia nacional, les digo que “No hay
cambio ni transformación sin participación humana. Únicamente se puede
transformar aquello que se conoce, y para conocerlo hay que estudiarlo.

A los estudiantes de esta facultad les deseo los mejores éxitos en su formación
profesional.

Dr. Gilbert Chua Ch.

Ilo, verano de 2023


Docente: Gilbert Chua

LA ESTADÍSTICA

ETIMOLOGÍA DE LA PALABRA ESTADÍSTICA

La noción de “estadística” procedió primitivamente del vocablo “estado”, porque ha


sido ocupación tradicional de todos los gobiernos de la civilización llevar registros de
las poblaciones que dominaban o gobernaban, entre eso registros se pueden
mencionar: los nacimientos, las defunciones, los censos poblacionales, cosechas,
impuestos y muchas otras clases de cosas y actividades que eran y son de importancia
para un gobernante. Contar y medir estos hechos generan muchas clases de datos
numéricos.

Son heterogéneos los vocablos que se citan como antecedentes del término
estadística. Sin intentar ser exhaustivos, pero si indagando para describir los de mayor
mención, se pueden nombrar los siguientes:

STATUS (latín), que significa situación, posición, estado.


STATERA (griego), que quiere decir balanza, ya que la estadística mide o
pesa hechos.

¿QUÉ ES LA ESTADÍSTICA?

Es la ciencia que tiene por objeto la clasificación y análisis de conjunto de datos de


observaciones, para interpretarlos y obtener leyes y relaciones entre ellas. Es la ciencia que
orienta la toma de decisiones a partir del análisis e interpretación de observaciones
realizadas en forma directa o experimentalmente.

La función de la estadística es elaborar principios y métodos que nos ayuden a tomar


decisiones frente a la incertidumbre.

¿POR QUÉ ESTUDIAR ESTADÍSTICA?

Porque constituye una ciencia auxiliar y complementaria, que ofrece técnicas, métodos,
modelos y procedimientos para el análisis cuantitativo y cualitativo de los fenómenos y
hechos que interesa estudiar a los profesionales.

Ayuda a cuantificar o dimensionar el comportamiento de los hechos y variables en una


población determinada, realizar estimaciones y proyecciones.

Porque ofrece los fundamentos lógicos en los que se sustente la investigación básica y
aplicada, de manera que ayuda a desarrollar una investigación rigurosa

Ayuda a conocer las características de una población y hacer sus inferencias, a partir de
datos obtenidos de una muestra representativa cuyos resultados orienta la toma de
decisiones.

Porque permite comprender con mayor facilidad la bibliografía especializada en economía,


finanzas, comercio, educación, psicología, medicina, etc. Que contienen resultados basados

2
Docente: Gilbert Chua

en el análisis estadístico. Sin lugar a dudas aquellos profesionales que no conozcan


estadística tendrán serias dificultades para ser expertos en su respectivo campo científico.

¿CUÁLES SON LOS OBJETIVOS DE LA ESTADÍSTICA?

a) Descripción de grandes colecciones de datos. - La descripción supone que los


datos que vienen expresados en su forma natural deben ser clasificados y presentados
sistemáticamente en cuadros o tablas como una primera reducción de datos, sin embargo,
así como expresados por un conjunto de indicadores, medidas de resumen o estadígrafos.

b) Análisis estadístico de datos experimentales y de los fenómenos observados. -


Consiste en inferir propiedades para una población sobre la base de resultados de una
muestra representativa con el objeto de formarse un concepto de una población o universo
y adoptar decisiones acertadas.

c) Predicción o comportamiento de los fenómenos en el futuro. - Lo cual constituye


la máxima aspiración practica de toda ciencia. Este objetivo de predicción y previsión esta
implícito tanto en la descripción como en el análisis estadístico, puesto que en general
interesa orientar la toma de decisiones con vigencia y efecto en el futuro. La predicción
puede entenderse como la estimación de resultados en el futuro.

DIVISIÓN DE LA ESTADÍSTICA. La estadística se divide en:

a) Estadística Descriptiva. - Es la que estudia las características de una población en su


totalidad, obtiene, organiza, resume, describe y analiza los datos a fin de describir en la
forma apropiada las diversas características de ese conjunto de datos.

b) Estadística Inferencial. - Es la que nos proporciona la teoría necesaria para inferir o


estimar las leyes de una población partiendo de una muestra obtenida de la propia
población y como estas conclusiones nunca pueden ser absolutamente ciertas, ellas estarán
ligadas al cálculo de probabilidades.

3
Docente: Gilbert Chua

ETAPAS LA INVESTIGACIÓN ESTADÍSTICA

La investigación estadística se preocupa fundamentalmente de la dimensión y la relación


de los elementos que caracterizan al fenómeno en estudio. La investigación estadística es
un proceso donde se distinguen cinco etapas.

1) Planeamiento o preparación de estudio: Que comprende los siguientes procesos


como: fundamentación y comprensión del estudio e identificación de las variables,
determinación de objetivos, organización de las variables, identificación y evaluación de las
fuentes de información, determinación del ámbito geográfico de la investigación, formación
y capacitación del equipo de trabajo, elaboración del cronograma de trabajo, formulación
del presupuesto y fuentes de financiamiento.

2) Recopilación de datos: Es el momento en el cual el investigador se pone en contacto


con los objetos o elementos sometidos a estudio, con el propósito de obtener los datos o
respuestas de las variables consideradas; Este trabajo puede realizarse mediante dos
modalidades:
a) la técnica de investigación documental o fuentes secundarias
b) la técnica de trabajo de campo o fuentes primarias.

3) Organización y presentación de datos: Consiste en la organización clasificación, y


fabulación, de modo que se facilite la presentación en tablas, cuadros o gráficos, de
manera que facilita el cálculo de los indicadores con los cuales se inicia la descripción
análisis e interpretación de los datos, variable e información estadística.

4) Análisis e interpretación de los datos: Se aplican los argumentos matemáticos y


teóricos de la estadística. A través de metidos estadísticos se calculan indicadores y
medidas de resumen, se establecen relaciones entre variables, se estiman valores, se
ejecutan pruebas estadísticas, etc.

5) formulación de conclusiones y preparación del informe: Permite elaborar un


resumen de los aspectos sustantivos, que luego se expresaran en forma de conclusiones y
sugerencias orientadoras en la toma de decisiones. La presentación puede ser en boletines,
anuarios, memorias o artículos, tesis, resultados de investigación, etc.

4
Docente: Gilbert Chua

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

Cuadros Estadísticos: Un cuadro estadístico es el resultado de trabajos previos


(planeamiento, recopilación, tabulación, cálculos, etc.), el cuadro es el arreglo ordenado,
columnas y filas, de datos estadísticos, con el objeto de ofrecer información estadística de
fácil lectura, comparación e interpretación. Estos cuadros se incluyen frecuentemente en el
cuerpo de los estudios, de las investigaciones o de los informes. Cada cuadro estadístico
puede tomar una forma particular o propia.

Partes Principales de un Cuadro Estadístico: Un cuadro estadístico completo,


presenta las siguientes partes:

- Numero del cuadro.


- Titulo.
- Encabezamiento de conceptos.
- Cuerpo.
- Nota de pie o llamadas.
- Fuente.
- Nota de unidad de medida.
- Elaboración.

Por ejemplo, en el cuadro numero 1 se presenta la Población Económicamente Activa (PEA)


De 15 años y más, de la Región de Loreto, clasificada de acuerdo a dos variables: nivel de
educación y provincias. Es un cuadro de tipo bidimensional; en esta clasificación se
distingue una variable principal (nivel de educación) colocada en forma horizontal y una
variable secundaria (provincias) colocada en forma vertical.
Para diferenciar las variables principal y secundaria, en el titulo del cuadro, se antepone la
palabra POR a la variable principal (nivel educativo) y SEGÚN a la variable secundaria
(provincias).

TABLA 01:

POBLACION ECONOMICAMENTE ACTIVA DE 15 Y MAS AÑOS DE LA REGION


LORETO POR NIVEL DE EDUCACION ALCANZADO SEGÚN PROVINCIAS. CENSO DE
POBLACION DEL 2017 (Distribución porcentual)

Nivel educativo
Total
PEA
Provincias Total Sin Nivel Primaria Secundaria Superior

TOTAL 1/ 141 750 100.0 7.5 44.1 32.4 16.0


Maynas 78 890 100.0 5.2 36.0 38.1 20.7
A. Amazonas 22 508 100.0 13.5 52.2 24.3 10.0
Loreto 11 038 100.0 12.5 60.5 19.7 7.3
M. Ramón 6 564 100.0 14.0 53.8 23.5 8.7
Castilla 11 828 100.0 7.2 58.5 25.5 8.8
Requena 10 922 100.0 4.4 59.7 27.1 8.8
Ucayali

5
Docente: Gilbert Chua

Elementos de una tabla de frecuencias, podemos identificar los siguientes


elementos:

1) Intervalo de Clase: Es la longitud de intervalo, podemos definirlo como: Li < x


< Ls

2) Frecuencia Absoluta (fi): Es el número de datos que cae dentro de cada intervalo. Se
representa por: 0 < fi < n donde: n=Nº total de datos.

3) Frecuencia Absoluta Acumulada (Fi): Es aquella que resulta de sumar


sucesivamente las frecuencias absolutas donde:

F1= f1
F2= f1+ f2
F3= f1+ f2 + f3
………….
Fk= f1+ f2 + f3+…..+ fk=n

4) Frecuencia Relativa (hi): Es el cociente entre la frecuencia absoluta y el número


total de datos.

hi = fi
n
0 < hi < 1 n = Nº total de datos

5) Frecuencia Relativa Acumulada (H): Es aquella que resulta de sumar


sucesivamente las frecuencias relativas, donde:

H1= h1
H2= h1 + h2
H3= h1 + h2 + h3
………………………..
Hk= h1 + h2 + h3+…. + hk =1

6) Marca de clase (Xi): Son los puntos medios de los intervalos de clase, donde:

Sea el intervalo: Li < xi < Ls Xi= Li + Ls


2

6
Docente: Gilbert Chua

TABLA 02:

DISTRIBUCIÓN DE FRECUENCIA (Para datos numéricos)

Intervalo de
Clase Xi fi Fi hi Hi hi*100% Hi*100%
Li < x ≤ Ls

L0 < x ≤ L1 X1 f1 F1 h1 H1 h1*100% H1*100%


L1 < x ≤ L2 X2 f2 F2 h2 H2 h2*100% H2*100%
L2 < x ≤ L3 X3 f3 F3 h3 H3 h3*100% H3*100%
………….. ….. … … … … ……… ………..
………….. ….. … … … … .…….. ……….
Li < x ≤ Ls Xm fm Fm hm Hm hm*100% Hm*100%

Regla para la construcción de una distribución de frecuencias

1) Determinar el Rango (R): Es la longitud de alcance que resulta por la diferencia


del mayor y menor valor.

Rango= Vmáx – Vmin

2) Determinar el número de intervalos de clase (K): Son grupos que resultan de


particionar el recorrido; el número de grupos (k) se determina por la regla de
STURGES.

K = 1+3. 32Log(n)

Donde: n = Nº total de datos

3) Determinar la amplitud Interválica o ancho de clase (C): Este dado por:

Rango
C
K

¿COMO REDONDEAR DATOS?

a) Si la cantidad que se va a eliminar es mayor a 5, entonces el último digito retenido se


aumenta en una unidad, si no es mayor, entonces permanece sin variación.

Ejemplo: Redondear el dato a 2 decimales

3. 279 = 3. 28 7. 341 = 7. 34

b) Si la cantidad que se va a eliminar es igual a 5, se tiene en cuenta lo siguiente:


- Si el último número es par, entones no cambia

7
Docente: Gilbert Chua

Ejemplo: 41. 3745 = 41. 374

- Si el último número es impar, entonces se le aumenta una unidad.


Ejemplo: 73. 4375 = 73. 438

REPRESENTACIONES GRÁFICAS DEL CUADRO DE DISTRIBUCIÓN DE


FRECUENCIAS

La importancia de los gráficos estadísticos es que estas representaciones cumplen u rol


muy importante, puesto que basta mirar un grafico para entender con facilidad los cambios
en las variables involucradas. Los más usados son:

- Histogramas - Curvas de frecuencias


- Polígono de frecuencias - Ojivas

- Histogramas: Es aquella representación grafica de las frecuencias en forma de


rectángulos cuyas áreas son proporcionadas por las frecuencias de clases, la altura de los
rectángulos depende de la magnitud de las frecuencias ya sean absolutas o relativas.
-
Si un histograma utiliza frecuencias absolutas, se le conoce como histograma de
frecuencias absolutas y si utiliza frecuencias relativas, se le conoce como frecuencias
relativas.

Histograma de Frecuencias Absolutas. Histograma de Frecuencias Relativas

Intervalos Intervalos

- Polígono de Frecuencias: Es la representatividad grafica de las frecuencias, ya sean


absolutas o relativas, esta se obtiene uniendo con rectas los puntos medios de los
intervalos de clase en el histograma.

8
Docente: Gilbert Chua

Intervalo de clase
- Curva de Frecuencias: Es aquella representación grafica que consiste en suavizar
los polígonos de frecuencias absolutas y relativas, de modo tal que expresen en forma
de curvas.

Intervalo de clase.

- Ojiva o Polígono de Frecuencias Acumuladas: Es aquella representación grafica


de una distribución acumulada que permite saber cuantas observaciones quedan por
encima o por debajo de ciertos valores.

Tabla de distribución de frecuencias Acumuladas.

Frecuencias Frecuencias
Menores Absolutas (Fi) Relativas
que: (H)

L.inferio 1 0 0
L.inferio 2 F1 H1
L.inferio 3 F2 H2
L.inferio 1 F3 H3
. . .
. . .
. . .

9
Docente: Gilbert Chua

Xi-1 X Intervalos

Ejemplo de aplicación:

El siguiente cuestionario se preparó para conocer las características de los


padres de familia de la Institución Educativa Daniel Becerra Ocampo

1. ¿Cuál es su grado de instrucción?


a) Analfabeta
b) Primaria
c) Secundaria
d) Superior

2. ¿Cuál es su ocupación actual?


a) Obrero
b) Empleado
c) Desempleado
d) Independiente
e) Agricultor

3. Número de hijos_______

4. ¿Edad en años?________

Nº DE
Nº GENERO EDUCACIÓN OCUPACIÓN EDAD
HIJOS
1 Mujer Primaria Obrero 2 25
2 Hombre Analfabeta Empleado 3 45
3 Mujer Primaria Desempleado 4 44
4 Mujer Secundaria Independiente 1 23
5 Hombre Superior Agricultor 2 34
6 Hombre Secundaria Desempleado 3 36
7 Hombre Primaria Empleado 4 45

10
Docente: Gilbert Chua

8 Mujer Secundaria Desempleado 5 46


9 Mujer Superior Independiente 3 34
10 Mujer Superior Desempleado 4 25
11 Hombre Secundaria Empleado 3 27
12 Hombre Primaria Desempleado 2 34
13 Hombre Secundaria Independiente 3 30
14 Hombre Superior Obrero 4 27
15 Mujer Primaria Empleado 1 38
16 Hombre Secundaria Obrero 2 45
17 Hombre Superior Empleado 3 36
18 Hombre Primaria Agricultor 1 45
19 Hombre Analfabeta Independiente 2 53
20 Mujer Primaria Empleado 3 51
21 Mujer Secundaria Independiente 2 53
22 Hombre Analfabeta Agricultor 3 48
23 Hombre Primaria Obrero 4 38
24 Hombre Secundaria Empleado 5 49
25 Mujer Analfabeta Independiente 4 51
26 Mujer Primaria Agricultor 3 50
27 Mujer Secundaria Desempleado 4 52
28 Mujer Superior Independiente 5 35
29 Mujer Primaria Agricultor 4 28
30 Hombre Secundaria Independiente 3 26
31 Mujer Superior Empleado 4 29
32 Mujer Primaria Obrero 5 52
33 Hombre Secundaria Independiente 3 37
34 Mujer Superior Agricultor 2 26
35 Mujer Analfabeta Agricultor 1 48
36 Mujer Secundaria Independiente 2 39
37 Hombre Primaria Obrero 2 25
38 Mujer Analfabeta Empleado 3 45
39 Mujer Primaria Desempleado 4 44
40 Mujer Secundaria Independiente 1 23
41 Hombre Superior Agricultor 2 34
42 Mujer Secundaria Desempleado 3 36
43 Mujer Primaria Empleado 4 45
44 Hombre Secundaria Desempleado 5 46
45 Mujer Superior Independiente 3 34
46 Hombre Superior Desempleado 4 25
47 Mujer Secundaria Empleado 3 27
48 Mujer Primaria Desempleado 2 34
49 Mujer Secundaria Independiente 3 30
50 Hombre Superior Obrero 4 27
51 Mujer Primaria Empleado 1 38
52 Mujer Secundaria Obrero 2 45

11
Docente: Gilbert Chua

53 Mujer Superior Empleado 3 36


54 Hombre Primaria Agricultor 1 45
55 Mujer Analfabeta Independiente 2 53
56 Mujer Primaria Empleado 3 51
57 Mujer Secundaria Independiente 2 53
58 Mujer Analfabeta Empleado 4 51
59 Hombre Secundaria Desempleado 1 50
60 Hombre Primaria Agricultor 5 40

Se pide:

Reconocer el tipo de variables y determinar el cuadro de distribución de


frecuencias para cada tipo de variables e interpretar.

Desarrollo para casos de datos categóricos

 Para variable categorica ordinal

TABLA 03:

DISTRIBUCIÓN POR GRADO DE INSTRUCCIÓN DE PADRES DE


FAMILIA DE LOS ALUMNOS, EN LA INSTITUCIÓN EDUCATIVA
DANIEL BECERRA OCAMPO, 2023

EDUCACIÓN Frecuencia Porcentaje Porcentaje acumulado

Analfabeta 8 13.3% 13.3%


Primaria 19 31.7% 45.0%
Secundaria 20 33.3% 78.3%
Superior 13 21.7% 100.0%
Total 60 100.0%
FUENTE: Elaborado por el investigador

12
Docente: Gilbert Chua

INTERPRETACION:

 Del total de padres de familia en la Institución educativa, son 19


padres de familia que tienen el grado de instrucción de primaria.

 Del 100% de padres de familia en la Institución educativa, el 21.7%


tienen el grado de instrucción superior.

 Del 100% de padres de familia, en la Institución educativa, el 78.3%


tienen nivel educativo que van desde el grado de analfabeto, primaria
y secundaria.

 Para variable categórica nominal

TABLA 04:

DISTRIBUCIÓN POR OCUPACIÓN LABORAL DE PADRES DE FAMILIA


DE LOS ALUMNOS, EN LA INSTITUCIÓN EDUCATIVA
DANIEL BECERRA OCAMPO, 2023

OCUPACIÓN Frecuencia Porcentaje Porcentaje acumulado

Obrero 8 13.3% 13.3%


Empleado 15 25.0% 38.3%
Desempleado 12 20.0% 58.3%
Independiente 15 25.0% 83.3%
Agricultor 10 16.7% 100.0%
Total 60 100.0%
FUENTE: Elaborado por el investigador

13
Docente: Gilbert Chua

INTERPRETACION:

 Del total de padres de familia en la Institución educativa, son 15


padres de familia que tienen la ocupación laboral de empleado.

 Del 100% de padres de familia en la Institución educativa, el 25%


tienen la ocupación laboral de independientes.

 Del 100% de padres de familia, el 58.3% tienen nivel educativo que


son de obrero, empleado y desempleado.

TABLA 05:

DISTRIBUCIÓN POR GENERO DE PADRES DE FAMILIA DE LOS


ALUMNOS, EN LA INSTITUCIÓN EDUCATIVA DANIEL BECERRA
OCAMPO, 2023

GENERO Frecuencia Porcentaje Porcentaje acumulado

Hombre 25 41.67% 41.67%


Mujer 35 58.33% 100.00%
Total 60 100.00%
FUENTE: Elaborado por el investigador

14
Docente: Gilbert Chua

INTERPRETACION:

 Del total de padres de familia en la Institución educativa, son 25


padres de familia que son varones.

 Del 100% de padres de familia en la Institución educativa, el 58.33%


son mujeres.

 Para variable numérica discreto

TABLA 06:

DISTRIBUCIÓN POR NÚMERO DE HIJOS DE PADRES DE FAMILIA


DE LOS ALUMNOS, EN LA INSTITUCIÓN EDUCATIVA DANIEL BECERRA
OCAMPO, 2023

Nº DE HIJOS Frecuencia Porcentaje Porcentaje acumulado

1 Hijo 8 13.3% 13.3%


2 Hijos 14 23.3% 36.7%
3 Hijos 18 30.0% 66.7%
4 Hijos 14 23.3% 90.0%
5 Hijos 6 10.0% 100.0%
Total 60 100.0%
FUENTE: Elaborado por el investigador

INTERPRETACION:

 Del total de padres de familia en la Institución educativa, son 14


padres de familia que tienen 2 hijos.

 Del 100% de padres de familia en la Institución educativa, el 30% de


padres de familia, tienen 3 hijos

15
Docente: Gilbert Chua

 Del 100% de padres de familia, en la Institución educativa, el 66.7%


de padres de familia, tienen 1, 2 y 3 hijos.

 Para variable numérica continuo

EDAD:

25 45 44 23 34 36 45 46 34 25 27 34 30 27 38 45 36 45 53 51 53 48 38
49 51 50 52 35 28 26 29 52 37 26 48 39 25 45 44 23 34 36 45 46 34 25
27 34 30 27 38 45 36 45 53 51 53 51 50 40

Paso 1 Rango:
R  V .máx  V .mín
R  53  23
R  30

Paso 2 Regla de Sturges:

K  1  3.32 log( n)
K  1  3.32 log( 60)
K  6.9  7

Paso 3 Ancho de clase:


Rango 30
C   4,28  5
K 7

TABLA 07:

DISTRIBUCIÓN SEGÚN EDAD DE PADRES DE FAMILIA DE LOS


ALUMNOS, EN LA INSTITUCIÓN EDUCATIVA DANIEL BECERRA
OCAMPO, 2013

Frecuencia
Frecuencia Frecuencia Frecuencia
Frecuencia Frecuencia relativa
absoluta relativa relativa
EDAD absoluta relativa porcentual
acumulada acumulada porcentual
acumulada
fi Fi hi Hi hi% Hi%
23 ≤ x ≤ 28 13 13 0.217 0.217 21.70% 21.70%
28 < x ≤ 33 3 16 0.050 0.267 5.00% 26.70%
33 < x ≤ 38 15 31 0.250 0.517 25.00% 51.70%
38 < x ≤ 43 2 33 0.033 0.550 3.30% 55.00%
43 < x ≤ 48 14 47 0.233 0.783 23.30% 78.30%
48 < x ≤ 53 13 60 0.217 1.000 21.70% 100.00%
TOTAL 60 1 100.00%
FUENTE: Elaborado por el investigador

16
Docente: Gilbert Chua

INTERPRETACION:

 Del total de padres de familia en la Institución educativa, son 15


padres de familia cuyas edades van desde mayores que 33 años hasta
38 años de edad.

 Del total de padres de familia en la Institución educativa, son 14


padres de familia cuyas edades van desde mayores que 43 años hasta
48 años de edad.

 Del total de padres de familia en la Institución educativa, son 31


padres de familia cuyas edades van desde 23 años hasta 38 años de
edad.

 Del total de padres de familia en la Institución educativa, son 47


padres de familia cuyas edades van desde 23 años hasta 48 años de
edad.

 Del 100% de padres de familia en la Institución educativa, el 5% de


padres de familia, tienen edades que van desde mayores que 28 años
hasta los 33 años.

 Del 100% de padres de familia, en la Institución educativa, el 55% de


padres de familia, tienen edades que van desde los 23 años hasta los
43 años de edad.

Histograma

Polígono de frecuencias

17
Docente: Gilbert Chua

Curva de frecuencias

1. La inversión real (en miles de dólares) anual de un grupo de pequeñas


empresas fueron:

10 12 8 40 6 8 10 30 2 8 6 14 16 20 25 28 30 26 30 4 6 10 18
17 13 17 21 7 6 8 14 7 15 19 27 22 0 14 6 8 9 11 13 15 20 30
60 12 6 5 6 5 8 7 12 15 36 39 52

2. Los datos presentan los lapsos en minutos necesarios para 50 clientes del
Banco de Crédito que realizan una transacción bancaria en minutos.

2.3 5.8 9.5 0.8 1.6 0.4 0.5 1.4 0.2 2.8 1.8 0.9 1.9 1.3 6.8 2.9 3.3
4.7 0.4 2.4 1.1 5.2 0.4 9.7 0.7 1.3 4.6 5.5 6.3 2.8 2.5 6.2 3.1 3.8
3.4 7.6 2.4 5.6 1.2 3.7 1.5 4.2 1.4 4.4 3.3 7.8 7.2 2.7 1.2 0.5

18
Docente: Gilbert Chua

ANÁLISIS E INTERPRETACIÓN DE DATOS UNIDIMENSIONAL

ESTADIGRAFOS: En esta etapa, la estadística plantea reducir los datos y sustituir toda la
tabla de frecuencias por unos pocos valores representativos del conjunto o por unas pocas
características descriptivas de los aspectos fundamentales de la distribución considerada;
Estas características descriptivas constituyen los llamados ESTADIGRAFOS, que son
indicadores o medidas de resumen estadísticos.
Como medidas de resumen del comportamiento de estas distribuciones se definen cuatro tipos
de ESTADIGRAFOS.

a) Medidas de Posición o Tendencia Central y no central


b) Medidas de Dispersión o Variabilidad.
c) Medidas de Deformación o Asimetría.
d) Medidas de Apuntamiento o Kurtosis.
e) Medidas de Concentración

a).1 Medidas de Posición o Tendencia Central: Describen la posición que ocupa una
distribución de frecuencia alrededor de un valor de la variable y son llamados generalmente
promedios, obtenidos a partir de datos cuantitativos de una población o muestra y son:

 La media aritmética.
 La media geométrica
 La media armónica
 La mediana
 La moda

 ¿Qué es la media aritmética?

La media aritmética o promedio es la medida central, es decir es la suma de los valores


observados de la variable, dividido por el número de observaciones, y se puede calcular con
datos no agrupados y datos agrupados (tabulados)

 ¿Qué es la media geométrica?

La media geométrica, es aquella que se usa especialmente en los casos en que existe una
tasa de crecimiento relativamente constante (población, montos, medios de capitales
sujetos a interés compuesto, etc). O simplemente, cuando se desea un porcentaje medio de
crecimiento o de baja, según corresponda.

La media geométrica se utiliza para promediar porcentajes, tasas, índices de precios, etc.
es decir, en aquellos casos en los que la variable representa variaciones acumulativas.

 ¿Qué es la media armónica?

La media armónica, se emplea para obtener un valor representativo de un conjunto de


datos expresados en forma de tasas, también se utiliza para promediar velocidades, precios
por unidad, cambios de divisas, etc.

19
Docente: Gilbert Chua

 ¿Qué es la mediana?

Es aquel valor, Me, que divide a la muestra ordenada en dos partes iguales, es decir, hay el
mismo número de datos menores que la mediana como mayores que ella. Si hay un número
impar de observaciones, la mediana es el único valor central

 ¿Qué es la moda?

Es el valor que se presenta con más frecuencia. Se nota Mo. Puede haber varias modas.

Para variables discretas y atributos su cálculo es inmediato. En las variables continuas


la mayor o menor frecuencia de las observaciones en un intervalo depende en parte de su
amplitud, por lo que para calcular la moda consideraremos las frecuencias observadas en
conjuntos de igual amplitud (amplitud unidad).

Medidas de
Para datos sueltos o Para datos agrupados o tablas
tendencia
tablas sin frecuencias con frecuencias
central

Media X
X  FX
Aritmética n X 
n

Media
G  n X 1  X 2  X 3 ... X n  f log x 
G  Anti log 
Geométrica
 n 
n n
Media H H
1 f
Armónica x x

 n  Fi 1 
Mediana Valor central
Me  Li  C  2 
 Fi  Fi 1 
 

Valor con mayor  f i  f i 1 


Moda Mo  Li  C  
frecuencia  ( f i  f i 1 )  ( f i  f i 1 ) 

20
Docente: Gilbert Chua

Ejemplo para datos sueltos o tablas sin frecuencias

Dado las siguientes edades de niños 5, 7, 11, 12, 14

5  7  11  12  14
 Media Aritmética: X   9 .8
5

 Media Geométrica: G  5 5  7  11 12  14  9.1654

5
 Media Armónica: H  8.4957
1 1 1 1 1
   
5 7 11 12 14

 Mediana: 5, 7, 11, 12, 14

Primero ordenamos de menor a mayor (como ya están ordenador)


Luego la mediana es:

5, 7, 11, 12, 14
Me

Si tuviera datos como: 11, 7, 15, 12, 9, 10

Ordenando de menor a mayor: 7, 9, 10, 11, 12, 15

10  11
Luego la mediana seria: Me   10.5
2

 Moda:

1 2 3 5 7 9 8 11 12 (No hay moda)


2 2 5 7 9 9 9 10 10 11 13 (moda=9)
3444557779 (moda=4, moda=7) Distribución bimodal

Ejercicios: Dado datos sueltos

1. Los datos proporcionan los sueldos mensuales (en dólares) de 10 empleados de


la Empresa Minera “PIRAMIDE S.A.” En el presente año.

440 560 335 587 613 400 424 466 565 393

2. Se tiene información sobre la venta de libros en soles, realizadas por una


empresa comercializadora de libros durante una semana determinada.

274.12 289.94 300.11 274.11 315.01 311.40 274.13

21
Docente: Gilbert Chua

3. La inversión en miles de dólares anual de un grupo de pequeñas micro


empresas fueron:

17 13 17 21 7 6 8 14 7 15 19 27 22

Ejemplo para datos agrupados o tablas con frecuencias

Dado los datos agrupados o tablas con frecuencias del ejercicio anterior acerca del
cuestionario para conocer las características de los padres de familia de la Institución
Educativa Daniel Becerra Ocampo

Frecuencia
Marca de Marca de
Logaritmo absoluta
Marca Frecuencia clase por clase sobre
de marca por Log. de
EDAD de clase absoluta Frecuencia frecuencia
de clase marca de
absoluta absoluta
clase
Xi fi fi.Xi LogXi fi.LogXi fi/Xi
23 ≤ x ≤ 28 25.5 13 331.5 1.407 18.285 0.510
28 < x ≤ 33 30.5 3 91.5 1.484 4.453 0.098
33 < x ≤ 38 35.5 15 532.5 1.550 23.253 0.423
38 < x ≤ 43 40.5 2 81.0 1.607 3.215 0.049
43 < x ≤ 48 45.5 14 637.0 1.658 23.212 0.308
48 < x ≤ 53 50.5 13 656.5 1.703 22.143 0.257
TOTAL 60 2330.0 94.561 1.645
FUENTE: Elaborado por el investigador

fi. Xi 2330
 Media Aritmética: X    38.83 años
n 60

La edad promedio es de 38.83 años, de los padres de familia de la Institución


Educativa Daniel Becerra Ocampo.

 f log x 
 Media Geométrica: G  Anti log 
 n 

 94.561
G  Anti log   37.67 años
 60 

El promedio geométrico es de 37.67 años, para la variable edad de los padres de


familia de la Institución Educativa Daniel Becerra Ocampo.

22
Docente: Gilbert Chua

n 60
 Media Armónica: H   36.47 años
f
x
1.645

El promedio armónico es de 36.47 años para la variable edad de los padres de familia
de la Institución Educativa Daniel Becerra Ocampo.

 Mediana:
 n  Fi 1 
Me  Li  C  2 
 Fi  Fi 1 
 

n 60
Primero hallamos:   30
2 2

Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
Límite 23 ≤ x ≤ 28 13 13

Inferior 28 < x ≤ 33 3 16 Fi-1 El valor de 30 se encuentra


entre 16 y 31; por tanto:
33 < x ≤ 38 15 31 Fi
38 < x ≤ 43 2 33 16Fi-1 y 31Fi
43 < x ≤ 48 14 47
48 < x ≤ 53 13 60
60
El ancho de clase es C=5

Por tanto:
 30  16 
Me  33  5  37.67 años
 31  16 

Luego del total de padres de familia, el 50% tienen edades menores o iguales a 37.7
años, en tanto que el 50% restante, mayores a 37.7 años

Me
50% 50%
≤42.7>

23
Docente: Gilbert Chua

 Moda:

 f i  f i 1 
Mo  Li  C  
 ( f i  f i 1 )  ( f i  f i 1 ) 

Buscamos el dato de mayor frecuencia

Frecuencia
EDAD absoluta

fi
Limite 23 ≤ x ≤ 28 13
Inferior 28 < x ≤ 33 3 fi-1
33 < x ≤ 38 15 fi (Por ser el de mayor cantidad)
38 < x ≤ 43 2 fi+1
43 < x ≤ 48 14
48 < x ≤ 53 13
60
El ancho de clase es C=5

Por tanto:

 f i  f i 1   15  3 
Mo  Li  C    33  5   35.4 años
 ( f i  f i 1 )  ( f i  f i 1 )   (15  3)  (15  2) 

La edad mas frecuente entre los padres de familia de la Institución Educativa Daniel
Becerra Ocampo es de 35.4 años.

Ejercicios: hallar, para todos los casos las medidas de tendencia central

1. Dada la siguiente tabla incompleta acerca de la distribución de frecuencias en base al


ingreso familiar de 200 familias

Ingreso fi Fi
35
240
45 120
157
280
20

24
Docente: Gilbert Chua

2. En una encuesta sobre el ingreso de turistas a una ciudad según la edad, se obtuvo la
siguiente información donde el ancho de clase es 4

Edades fi Fi
10 m
a 2a
b c
a+b c+d
40 15 15c/7

3. La tabla muestra la distribución de pesos correspondientes a empleados

Pesos Xi fi Fi hi
70 0.075
5
18
79
7
40 0.175

4. Dado el cuadro estadístico, sabiendo que la mediana es 72.5 y que además pertenece
al quinto intervalo, Hallar el valor de “n”

Intervalos fi
30 40 2
40 50 3
50 60 4
60 70 1
70 80 n

5. Dado el cuadro estadístico, sabiendo que la moda es 32 y que además pertenece al


segundo intervalo, Hallar el valor de “n”

Intervalos fi
20 30 10
30 40 2n
40 50 4
50 60 n
60 70 5

25
Docente: Gilbert Chua

6. Dado el cuadro estadístico, sabiendo que la moda es 42 y que además pertenece al


cuarto intervalo, Hallar el valor de “n”

Intervalos fi
10 19 6
19 28 10
28 37 2n
37 46 14
46 5 3n

a).2 Medidas de posición no centrales. Llamados también Cuantiles, estos valores no


reflejan ninguna tendencia central, sino una posición de la distribución, dividiéndola a ésta en
partes iguales. Cabe citar entre los de uso más frecuente: Cuartiles, Deciles y Percentiles.

 Los Cuartiles son tres valores que dividen a la distribución en cuatro


partes iguales, estando en cada una de ellas el 25% de sus observaciones.
Se indican con Qi.

25% 25% 25% 25%


C1 C2 C3
n/4 2n/4 3n/4

 Los Deciles son nueve valores que dividen a la distribución en diez partes
iguales, estando en cada una de ellas el 10% de las observaciones. Se
indican por Di.

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9

 Los Percentiles son noventa y nueve valores que dividen a la distribución


en cien partes iguales, dejando un 1% de las observaciones entre cada dos
de ellos consecutivos. Se nombran por Pi.

1% 1% 1% …………………………………………………………… 1% 1% 1%
P1 P2 P3………………………………………….P97 P98 P99

Hay que tener en cuenta algunas relaciones entre ellos, como son:

Me = Q2 = D5 = P50
Q1 = P25; Q3 = P75
D1 = P10; D2 = P20; D3 = P30; D4 = P40; D6 = P60

26
Docente: Gilbert Chua

Medidas de tendencia Para datos agrupados o


no central tablas con frecuencias

 in 
 4  Fi 1 
Cuartiles Ci  Li  C  
 Fi  Fi 1 
 

 in 
 10  Fi 1 
Deciles Di  Li  C  
 Fi  Fi 1 
 

 in 
 100  Fi 1 
Percentiles Pi  Li  C  
 Fi  Fi 1 
 

Ejemplo

Dado los datos del ejercicio anterior acerca del cuestionario para conocer las
características de los padres de familia de la Institución Educativa Daniel Becerra
Ocampo.

 Hallando los cuartiles:

Para el primer cuartil o cuartil 1:

 1n 
 4  Fi 1 
C1  Li  C  
 Fi  Fi 1 
 

1n 1(60)
Primero hallamos:   15
4 4

27
Docente: Gilbert Chua

Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
Límite 23 ≤ x ≤ 28 13 13 Fi-1

Inferior 28 < x ≤ 33 3 16 Fi El valor de 15 se encuentra


entre 13 y 16; por tanto:
33 < x ≤ 38 15 31
38 < x ≤ 43 2 33 13Fi-1 y 16Fi
43 < x ≤ 48 14 47
48 < x ≤ 53 13 60
60
El ancho de clase es C=5

Por tanto:
15  13 
C1  28  5  31.33 años
16  13 

Luego del 100% de padres de familia, el 25% tienen edades menores o iguales a 31
años, en tanto que el 75% restante, mayores a 31 años.

75%

25% 25% 25% 25%


C1
31 años

 Hallando los Deciles:

Para el Decil 7 o Sétimo Decil:

 7n 
 10  Fi 1 
D7  Li  C  
 Fi  Fi 1 
 

7 n 7(60)
Primero hallamos:   42
10 10

28
Docente: Gilbert Chua

Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
23 ≤ x ≤ 28 13 13

28 < x ≤ 33 3 16 El valor de 42 se encuentra


entre 33 y 47; por tanto:
33 < x ≤ 38 15 31
Límite
Inferior 38 < x ≤ 43 2 33 Fi-1 33Fi-1 y 47Fi
43 < x ≤ 48 14 47 Fi
48 < x ≤ 53 13 60
60
El ancho de clase es C=5

Por tanto:
 42  33 
D7  43  5  46.21 años
 47  33 

Luego del 100% de padres de familia, el 70% tienen edades menores o iguales a 46
años, en tanto que el 30% restante, mayores a 46 años.

70% 30%

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D7
46 años

 Hallando los Percentiles:

Para el Percentil 85 o Centil 85:

 85n 
 100  Fi 1 
P85  Li  C  
 Fi  Fi 1 
 

85n 85(60)
Primero hallamos:   51
100 100

29
Docente: Gilbert Chua

Frecuencia
Frecuencia
absoluta
EDAD absoluta
acumulada
fi Fi
23 ≤ x ≤ 28 13 13

28 < x ≤ 33 3 16 El valor de 51 se encuentra


entre 47 y 60; por tanto:
33 < x ≤ 38 15 31
38 < x ≤ 43 2 33 47Fi-1 y 60Fi
Límite
Inferior 43 < x ≤ 48 14 47 Fi-1

48 < x ≤ 53 13 60 Fi
60
El ancho de clase es C=5

Por tanto:
 51  47 
P85  48  5  49.54 años
 60  47 

Luego del 100% de padres de familia, el 85% tienen edades menores o iguales a 49
años, en tanto que el 15% restante, mayores a 49 años

85% 15%

1% 1% 1% ……………………………………………………………
P1 P2 P3………………………………………….P85
49 años

Ejercicios:

1. Dado el cuadro estadístico, sabiendo que C2=46 y que además pertenece


al cuarto intervalo, Hallar el valor de “X”

Intervalos fi Fi
10 21 2
21 32 14
32 43 2X
43 54 X
54 65 50

30
Docente: Gilbert Chua

2. Dado el cuadro estadístico, sabiendo que D6=25 y que además pertenece


al tercer intervalo, Hallar el valor de “X”

Intervalos fi Fi
8 14 20
14 20 X+5
20 26 X
26 32
32 38 100

3. Dado el cuadro estadístico, sabiendo que D8=30 y que además pertenece


al cuarto intervalo, Hallar el valor de “X”

Intervalos fi Fi
7 14 10
14 21
21 28 38
28 35 45
35 42 X

4. Dado el cuadro estadístico, sabiendo que P90=250 y que además


pertenece al cuarto intervalo, Hallar el valor de “n”

Intervalos fi Fi
7 14 155
14 21
21 28 13n+5
28 35 n
35 42 300

5. Dado el cuadro estadístico, sabiendo que P80=50 y que además pertenece


al segundo intervalo, Hallar el valor de “n”

Intervalos fi Fi
20 40 150
40 60
60 80 8 178
80 100
100 120 n

31
Docente: Gilbert Chua

b) Medidas de Dispersión o Variabilidad:

En el tema anterior hemos definido una serie de medidas de tendencia central, cuyo objetivo
era tratar de sintetizar toda la información disponible, pero cabe preguntarse posteriormente si
esa medida es o no representativa de la distribución de frecuencias.

Si consideramos dos variables X e Y con distribuciones:

Las dos medias son iguales y sin embargo las dos distribuciones son muy diferentes pues los
valores de X están mucho más dispersa que los de Y.

Así pues, para intentar medir la representatividad de una determinada medida debemos de
cuantificar la separación de los valores de la distribución respecto de dicha medida. Resulta
necesario que, para completar la información de un promedio (por ejemplo media aritmética),
éste vaya acompañado de uno o varios coeficientes que nos midan el grado de dispersión de la
distribución de la variable con respecto a él.

Además estas medidas nos permiten tener una idea de cómo se agrupa la población respecto a
la media, esta medida cuantifica el grado de concentración o dispersión de los datos en torno
al promedio; si los datos están estrechamente concentrados, la dispersión será pequeña. En
cambio si los datos están dispersos, entonces la variabilidad será grande.

Distinguiremos dos tipos de medidas de dispersión: absolutas y relativas.

b).1 Medidas de dispersión absoluta:

Cabe citar entre éstas el recorrido, la desviación media, desviación mediana, la varianza y la
desviación típica. Todas son referidas en general a un promedio.

 El Rango.
 La Desviación media absoluta
 La Desviación mediana absoluta
 La varianza
 La desviación típica o estándar

 ¿Qué es el Rango o recorrido de la variable?

Es la primera medida de dispersión, no esta relacionada con ningún promedio


en particular, ya que este se relaciona con los datos mismos, puesto que su
cálculo se determina restándole al dato mayor de una serie el dato menor de

32
Docente: Gilbert Chua

la misma, más una unidad de medida (UM). El rango es el número de


variables diferentes que posee una serie de valores.

 ¿Qué es la desviación media absoluta?

La desviación media de un conjunto de N observaciones x1, x2,


x3,.............xn, es el promedio de los valores absolutos de las desviaciones
(di) con respecto a la media aritmética o la mediana. Si se denomina como
DM a la desviación media.

 ¿Qué es la desviación mediana absoluta?

La desviación mediana es el promedio de los valores absolutos de las


diferencias entre cada observación y la mediana de éstas.

 ¿Qué es la varianza?

Mide la dispersión o distancia de los datos, respecto de la media aritmética, x.


Esta medida está expresada en las unidades de los datos al cuadrado, por lo
que no tiene una interpretación fácil. Con el objeto de tener una medida de
dispersión expresada en las mismas unidades que los datos en estudio, se
define la desviación típica como la raíz cuadrada positiva de la varianza.

 ¿Qué es la desviación estándar?

Es la medida de dispersión más utilizada en las investigaciones por ser la más


estable de todas, ya que para su cálculo se utilizan todos los desvíos con
respecto a la media aritmética de las observaciones, y además, se toman en
cuenta los signos de esos desvíos. Se le designa con la letra castellana S
cuando se trabaja con una muestra y con la letra griega minúscula σ (Sigma)
cuando se trabaja con una población. Es importante destacar que cuando se
hace referencia a la población él número de datos se expresa con N y cuando
se refiere a la muestra él número de datos se expresa con n. La desviación
típica se define como:

“La raíz cuadrada positiva del promedio aritmético de los cuadrados de los
desvíos de las observaciones con respecto a su media aritmética”. La
desviación típica es una forma refinada de la desviación media”.

33
Docente: Gilbert Chua

Medidas
de Para datos sueltos o tablas Para datos agrupados o tablas
dispersión sin frecuencias con frecuencias
absoluta

Rango R  V .máx  V .mín R  V .máx  V .mín

Desviación xx  f xx


media
DM  DM 
n n

Desviación  x  Me  f x  Me
mediana
DMe  DMe 
n n

( x  x ) 2  f (x  x)2
S2  si, n  30 S2  si, n  30
N N
Varianza
( x  x ) 2  f (x  x)2
S 
2
si , n  30 S 
2
si, n  30
n 1 n 1

( x  x ) 2  f (x  x)2
S si, n  30 S si, n  30
N N
Desviación
estándar
( x  x ) 2  f (x  x)2
S si , n  30 S si, n  30
n 1 n 1

Ejemplo para datos sueltos o tablas sin frecuencias

Dado las siguientes edades de niños 5, 7, 11, 12, 14

R  14  5
 Rango:
R  9 años

34
Docente: Gilbert Chua

 Desviación Media:
xx
DM 
n

Se ha determinado que la media aritmética es 9.8 años

Nº Edades xx
1 5 4.8
2 7 2.8
3 11 1.2
4 12 2.2
5 14 4.2
TOTAL 15.2

Luego:
15.2
DM   3.04 años
5

 Desviación Mediana:

 x  Me
DMe 
n

Se ha determinado que la mediana es 11 años

Nº Edades x  Me
1 5 6
2 7 4
3 11 0
4 12 1
5 14 3
TOTAL 14

Luego:
14
DMe   2.8 años
5

 Varianza:

( x  x ) 2
S2  si , n  30
n 1

35
Docente: Gilbert Chua

Se ha determinado que la media aritmética es 9.8 años

Nº Edades ( x  x )2
1 5 23.04
2 7 7.84
3 11 1.44
4 12 4.84
5 14 17.64
TOTAL 54.8

Luego:
( x  x ) 2 54.8
S 
2
  13.7 años
n 1 4

 Desviación estándar:

13.7
S  1.85 años
4

b).2 Medidas de dispersión relativas:

En el caso de intentar comparar la dispersión de dos distribuciones mediante


alguna de las medidas de dispersión halladas antes, no podríamos efectuar tal
comparación porque las distribuciones, en general, no vendrán dadas en las
mismas unidades y tampoco porque los promedios en general también serán
diferentes. Por ello, para poder comparar las dispersiones, es preciso definir
medidas de dispersión adimensionales. Entre éstas se encuentra el coeficiente
de variación de Pearson.

 ¿Que es el coeficiente de Variación?:

Es una relación entre la media y el desvío estándar de una población, o de


una muestra extraída de ella. Da una idea del error relativo que se comete en
el sistema de medición. No es un estadígrafo de dispersión en un sentido
absoluto, sino una relación entre dos de ellos: el de dispersión respecto al de
posición. Una especie de coeficiente, que mide la dispersión en términos de la
media. El CV no da una buena idea de la “bondad” o “calidad” de dos series
de mediciones entre sí, sino una primera aproximación. Sin embargo, en la
bibliografía clínica es común encontrarlo usado como índice para decidir entre
dos métodos. Al respecto, se debe remarcar que, si bien es condición
necesaria, no es suficiente para optar entre técnicas clínicas; la forma
correcta de hacerlo se verá más adelante en la sección dedicada a ello.

36
Docente: Gilbert Chua

Se suele expresar en forma porcentual (CV %). Mientras en las ciencias


exactas, un sistema de medición con coeficientes superiores al 10% es
inaceptable, en medicina, donde las variabilidades inherentes al material de
trabajo son mucho más grandes, no se puede ser tan estricto. Por eso se
sugiere usar:

10% < CV% < 50% poco aceptables


1% < CV% < 10% aceptable
CV% < 1% muy aceptable

Finalmente, el CV, sirve para comparar en términos relativos, el grado de


concentración en torno a la media de dos distribuciones distintas y se obtiene a través
del cociente entre la desviación estándar y la media expresado en porcentaje.

S
CV   100
X

Ejemplo para datos sueltos o tablas sin frecuencias

Dado las siguientes edades de niños 5, 7, 11, 12, 14

Continuando con el ejercicio anterior, la media aritmética es de 9.8 años y además la


desviación estándar era de 1.85 años, por lo tanto:

1.85
CV   100
9 .8
CV  18.88%

Ejercicios: Dado datos sueltos

1. Los datos proporcionan los sueldos mensuales (en dólares) de 10 empleados de


la Empresa Minera “PIRAMIDE S.A.” En el presente año.

440 560 335 587 613 400 424 466 565 393

2. Se tiene información sobre la venta de libros en soles, realizadas por una


empresa comercializadora de libros durante una semana determinada.

274.12 289.94 300.11 274.11 315.01 311.40 274.13

3. La inversión en miles de dólares anual de un grupo de pequeñas micro


empresas fueron:

17 13 17 21 7 6 8 14 7 15 19 27 22

37
Docente: Gilbert Chua

Ejemplo para datos agrupados o tablas con frecuencias

De acuerdo al ejercicio anterior, se estableció que:

La media aritmética =38.83 años


La mediana = 42.67 años

EDAD Xi fi xx f.x  x x  Me f . x  Me


23 ≤ x ≤ 28 25.5 13 13.33 173.29 17.17 223.21
28 < x ≤ 33 30.5 3 8.33 24.99 12.17 36.51
33 < x ≤ 38 35.5 15 3.33 49.95 7.17 107.55
38 < x ≤ 43 40.5 2 1.67 3.34 2.17 4.34
43 < x ≤ 48 45.5 14 6.67 93.38 2.83 39.62
48 < x ≤ 53 50.5 13 11.67 151.71 7.83 101.79
TOTAL 60 496,66 513,02

 Rango: R  V .máx  V .mín

R  53  23
R  30

 f xx
 Desviación Media: DM 
n

496.66
DM   8.28 años
60

Esto quiere decir que el promedio de las desviaciones en edades (años), de los padres
de familia de los alumnos respecto al peso vivo promedio es de 8.28 años.

 f x  Me
 Desviación Mediana: DMe 
n

513.02
DMe   8.55 años
60

Esto quiere decir que el promedio de las desviaciones en edades (años), de los padres
de familia de los alumnos respecto al peso vivo mediano es de 8.55 años.

38
Docente: Gilbert Chua

EDAD Xi fi ( x  x )2 f .( x  x ) 2
23 ≤ x ≤ 28 25.5 13 177.689 2309.956
28 < x ≤ 33 30.5 3 69.389 208.167
33 < x ≤ 38 35.5 15 11.089 166.334
38 < x ≤ 43 40.5 2 2.789 5.578
43 < x ≤ 48 45.5 14 44.489 622.845
48 < x ≤ 53 50.5 13 136.189 1770.456
TOTAL 60 5083,334

 f .( x  x ) 2
 Varianza: S 
2

5083.334
S2   84.72 años
60

Esto quiere decir que las edades (años), de los padres de familia de los alumnos se
dispersa en promedio 84.72 años al cuadrado con respecto a la media aritmética o
valor central.

 f (x  x)2
 Desviación Estándar: S
N

5083.334
S  9.2044 años
60

Las edades de los padres de familia de los alumnos se dispersan en promedio 9.2
años con respecto a la media aritmética o valor central.

S
 Coeficiente de Variación: CV   100
X

9.2044
CV   100  23.7%
38.83

Las edades de los padres de familia de los alumnos se dispersan en promedio 23.7%
con respecto a la media aritmética o valor central, lo cual muestra que la media es
poco representativa y el análisis realizado es poco confiable.

39
Docente: Gilbert Chua

c) Medidas de Deformación o Asimetría

Tienen por objeto establecer el grado de simetría (o asimetría) de una distribución sin
necesidad de realizar la representación gráfica.

Entenderemos la simetría respecto al eje determinado por la media aritmética, detal forma
que diremos que una distribución es simétrica cuando los valores de la variable equidistantes
de este valor central tengan la misma frecuencia, en caso contrario diremos que es
asimétrica, siendo esta asimetría negativa o a izquierda si es más larga la rama de la
izquierda, es decir, las frecuencias descienden más lentamente por la izquierda que por la
derecha; análogamente llamaremos asimetría positiva o a derechas aquella en que la rama
de la derecha es más larga, es decir las frecuencias descienden más lentamente por la
derecha que por la izquierda.

c).1 Coeficiente de Asimetría de Fisher

Su interpretación será:

 (ASF = 0): Se acepta que la distribución es Simétrica, es decir, existe


aproximadamente la misma cantidad de valores a los dos lados de la
media. Este valor es difícil de conseguir por lo que se tiende a tomar
los valores que son cercanos ya sean positivos o negativos (± 0.5).

 (ASF > 0): La curva es asimétricamente positiva por lo que los valores
se tienden a reunir más en la parte izquierda que en la derecha de la
media.

 (ASF < 0): La curva es asimétricamente negativa por lo que los valores
se tienden a reunir más en la parte derecha de la media.

Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la
distancia que separa la aglomeración de los valores con respecto a la media.

40
Docente: Gilbert Chua

c).2 Coeficiente de Asimetría de Pearson

Teniendo en cuenta que si la curva es simétrica, x = Me = Mo, si la distribución


es asimétrica positiva o a derechas x > Mo y si la distribución es simétrica
negativa o a izquierdas x < Mo, su interpretación será:

Si: ASp=0, La Distribución es Simétrica


Si: ASp >0, Distribución sesgada hacia la derecha o Asimetría Positiva.
Si: ASp<0, Distribución sesgada hacia la izquierda o Asimetría Negativa.

d) Medidas de Apuntamiento o Curtosis:

Estas medidas, aplicadas a distribuciones unimodales simétricas o con ligera asimetría,


tratan de estudiar la distribución de frecuencias en la zona central, dando lugar a
distribuciones muy apuntadas, o poco apuntadas.

Es el grado de deformación vertical (apuntamiento) de una distribución de frecuencias con


relación al grado de apuntamiento. Si una distribución tiene relativamente un elevado pico o
apuntamiento, se llama distribución Leptocurtica, mientras que si es anchada, se denomina
Platicurtica, la distribución normal constituye una distribución Mesocurtica.

Para estudiar el apuntamiento, debemos hacer referencia a una distribución tipo que
consideraremos la distribución "Normal"; ésta corresponde a fenómenos muy corrientes en la
naturaleza cuya representación gráfica es la campana de Gauss.

 Si: K=0, diremos que las curvas correspondiente a la distribución de


frecuencias es Mesocurtica (tiene igual apuntamiento que la normal).

 Si: K>0, diremos que la curva correspondiente a la distribución de frecuencias


es Platicurtica.

 Si: K<0, diremos que la curva correspondiente a la distribución de frecuencias


es Leptocurtica.

41
Docente: Gilbert Chua

Medidas de
Para datos sueltos o Para datos agrupados o
Deformación y
tablas sin frecuencias tablas con frecuencias
Apuntamiento

 ( x  x ) 3    f .( x  x ) 3 
   
AS F   N   N 
Asimetría de
3
AS F  3
Fisher
 ( x  x ) 2  2   f .( x  x ) 2  2
   
 N   N 

Asimetría de 3( X  Me) 3( X  Me)


AS P  AS P 
Pearson S S

 ( x  x ) 4    f .( x  x ) 4 
   
K  N  3 K  N  3
Curtosis
2 2 2 2
 ( x  x )    f .( x  x ) 
   
 N   N 

Ejemplo para datos sueltos o tablas sin frecuencias

Dado las siguientes edades de niños 5, 7, 11, 12, 14

 Asimetría de Fisher:
 ( x  x ) 3 
 
AS F   N 
3
 ( x  x ) 2  2
 
 N 

42
Docente: Gilbert Chua

Se ha determinado que la media aritmética es 9.8 años

Nº Edades ( x  x )2 (x  x)3
1 5 23.04 -110.592
2 7 7.84 -21.952
3 11 1.44 1.728
4 12 4.84 10.648
5 14 17.64 74.088
TOTAL 54.8 -46.080

 ( x  x ) 3    46.08 
   5   9.216
AS F   N     0.254
3 3
36.284
 ( x  x ) 
2 2
 54.8  2
   5 
 N 

 Asimetría de Pearson:

3( X  Me)
AS P 
S

Del ejercicio anterior se sabe que:

La media aritmética =9.8 años


La mediana = 11 años
La desviación estándar=1.85 años

3(9.8  11)
AS P   1.946
1.85

 Curtosis:
 ( x  x ) 4 
 
K   3
N
2
 ( x  x ) 2 
 
 N 

Nº Edades ( x  x )2 (x  x)4
1 5 23.04 530.8416
2 7 7.84 61.4656
3 11 1.44 2.0736
4 12 4.84 23.4256
5 14 17.64 311.1696
TOTAL 54.8 928.9760

43
Docente: Gilbert Chua

 ( x  x ) 4   928.976 
   5 
K  N  3 K 3 K
185.7952  3
K  1.453
 ( x  x ) 2 
2
 54.8 
2
10.962
   5 
 N 

Ejemplo para datos agrupados o tablas con frecuencias

De acuerdo al ejercicio anterior, se estableció que:

La media aritmética =38.83 años


La mediana = 42.67 años
La desviación estándar=9.2044 años

EDAD Xi fi ( x  x )2 f .( x  x ) 2 (x  x)3 f .( x  x ) 3
23 ≤ x ≤ 28 25.5 13 177.689 2.309.956 -2368.593 -30791.709
28 < x ≤ 33 30.5 3 69.389 208.167 -578.010 -1734.029
33 < x ≤ 38 35.5 15 11.089 166.334 -36.926 -553.891
38 < x ≤ 43 40.5 2 2.789 5.578 4.657 9.315
43 < x ≤ 48 45.5 14 44.489 622.845 296.741 4154.373
48 < x ≤ 53 50.5 13 136.189 1.770.456 1589.324 20661.218
TOTAL 60 5083.334 -8254.722

 Asimetría de Fisher:

  f .( x  x ) 3    8254.722 
   
  AS F  
N 60
AS F  3 3 AS F  0.176
  f .( x  x ) 
2 2
 5083.334  2
   60 
 N 

Según el método de Fisher la distribución es ASp<0, lo cual muestra que la


distribución es sesgada hacia la izquierda o Asimetría Negativa, esto nos
muestra que son pocos los padres de familia cuyas edades son bajas y
muchos cuyas edades son altas.

AS < 0

44
Docente: Gilbert Chua

 Asimetría de Pearson:

3( X  Me) 3(38.83  42.67)


AS P  AS P   1.252
S 9.2044

Según el método de Pearson, la distribución es ASF<0, al igual que en el caso


anterior muestra que la distribución es sesgada hacia la izquierda o Asimetría
Negativa

 Curtosis:

EDAD Xi fi ( x  x )2 f .( x  x ) 2 (x  x)4 f .( x  x ) 4
23 ≤ x ≤ 28 25.5 13 177.689 2.309.956 31573.345 410453.487
28 < x ≤ 33 30.5 3 69.389 208.167 4814.819 14444.458
33 < x ≤ 38 35.5 15 11.089 166.334 122.964 1844.456
38 < x ≤ 43 40.5 2 2.789 5.578 7.778 15.556
43 < x ≤ 48 45.5 14 44.489 622.845 1979.262 27709.671
48 < x ≤ 53 50.5 13 136.189 1.770.456 18547.416 241116.414
TOTAL 60 5083.334 695584.043

  f .( x  x ) 4   695584 .043 
   
  3
K  3
N 60
K K  1.385
2 2 2
  f .( x  x )   5083.334 
   60 
 N 

Como K=-1.385<0, diremos que la curva correspondiente a la distribución de


frecuencias es Leptocurtica, esto demuestra que los datos se encuentran ligeramente
concentrados.

45
Docente: Gilbert Chua

Ejercicios: Para determinar la Asimetría y Curtosis

A. Dado los gastos diarios en soles de una persona durante el día

GASTO hi Hi
a/2
6 2m
3a
10 a 0.85
m

B. En la siguiente tabla de frecuencias se muestra las notas obtenidas por 100


alumnos

NOTAS fi hi Hi
24 0.18
26
72 0.78

C. En un centro pediátrico, los niños atendidos fueron clasificados según su edad

EDAD fi hi Fi Hi
0 0.2
20
0.85
12 80

D. Dado el número de alumnos por aula en un colegio, con un ancho de clase


constante e igual a 5.

Nº DE
xi fi Fi xi.fi
ALUMNOS

210
40 320
20
30
8 80

46
Docente: Gilbert Chua

e) Medidas de Concentración:

En una distribución, ni la media ni la varianza son explicativas de la mayor o menor igualdad


en el reparto; para esto usamos las medidas de concentración.

Las medidas de concentración miden la mayor o menor igualdad en el reparto de una


cantidad (por ejemplo, la masa salarial total de una empresa,). Ante este problema
eminentemente económico, medidas estadísticas como la media, la varianza, no son
significativas, por lo que es necesario construir unos indicadores específicos. Debido a la
naturaleza de los fenómenos que aquí se consideran, las variables tomarán sólo valores
positivos (por éste y otros motivos, no deben hacerse cambios de origen).

Consideremos que la variable en cuestión es el salario. Una distribución muy concentrada


indica que pocos individuos reciben la mayor parte del total, mientras que poca concentración
supone que todos los individuos tienen un reparto igualitario.

La característica que se va a estudiar puede presentar las siguientes situaciones límite:

 Máxima concentración: Cuando un solo individuo recibe la cantidad total a repartir y el


resto nada.

 Equidistribución (mínima concentración): Todos los individuos reciben la misma


cantidad.

Entre ambas situaciones extremas hay infinidad de situaciones intermedias que trataremos
de cuantificar con las siguientes medidas de concentración:

- Índice de Gini

Para una población determinada el índice de Gini puede oscilar entre cero (0) y uno (1).
Tomaría un valor de cero cuando todos los integrantes de la población reciben el mismo
ingreso. Por el contrario, el uno significa que un miembro o unos pocos perciben todo el
ingreso y los restantes nada.

Para calcular el índice de Gini se usa frecuentemente la ecuación

N 1 N 1

( p i  qi ) q i
IG  i 1
N 1
 1 i 1
N 1

p
i 1
i p
i 1
i

- Curva de Lorenz

La curva de Lorenz o curva de concentración es una gráfica que se deduce a partir de la


información suministrada para el cálculo del índice de Gini y que, por tanto, refleja la mayor
o menor concentración en la distribución de una magnitud. Como expondremos a
continuación, existe una relación directa entre el índice de Gini y la forma de la curva de
Lorenz, suponiendo ésta última una información adicional muy interesante sobre la forma en
que se ha llevado a cabo el reparto de la cuantía total.

47
Docente: Gilbert Chua

De tal forma que en el caso de mínima concentración la curva de Lorenz se confundirá con la
diagonal. Luego, cuanta mayor concentración se establezca en el reparto, mayores serán las
diferencias (pi - qi) y, por tanto, más alejada de la diagonal aparecerá la curva de Lorenz. En
el otro caso extremo de máxima concentración la curva de Lorenz quedará formada por el
propio eje de abscisas y la vertical trazada por el punto de abscisa igual a 100. Tal como se
refleja en los siguientes gráficos:

Ejemplo para determinar índice de Gini

Dado los datos agrupados o tablas con frecuencias del ejercicio anterior acerca del
cuestionario para conocer las características de los padres de familia de la Institución
Educativa Daniel Becerra Ocampo.

EDAD xi fi Fi xi.fi ui pi qi
23 ≤ x ≤ 28 25.5 13 13 331.5 331.5 21.7 14.2 N 1
28 < x ≤ 33 30.5 3 16 91.5 423.0 26.7 18.2 q
i 1
i
33 < x ≤ 38 35.5 15 31 532.5 955.5 51.7 41.0 N 1
38 < x ≤ 43 40.5 2 33 81.0 1036.5 55.0 44.5 p i
43 < x ≤ 48 45.5 14 47 637.0 1673.5 78.3 71.8 i 1

48 < x ≤ 53 50.5 13 60 656.5 2330.0 100.0 100.0


TOTAL n=60 ∑ xi.fi =2330 333.3 289.7

Fi ui
pi  x100 qi  x100
n  xi f i

48
Docente: Gilbert Chua

N 1 N 1

 ( pi  qi ) q i
189.7
IG  i 1
N 1
 1 i 1
N 1
IG  1   0.187
p p
233.3
i i
i 1 i 1

El índice de Gini es un indicador entre 0 y 1, cuanto mas próximo esté a 1 indica una mayor
concentración, lo cual indica que los padres de familia en cuanto a sus edades, estas tienen
una débil concentración y en consecuencia la distribución en sus edades son casi equitativos
para los 60 padres de familia, como se muestra en la siguiente grafica.

pi qi pi
0 0 0
21.7 14.2 21.7
26.7 18.2 26.7
51.7 41.0 51.7
55.0 44.5 55.0
78.3 71.8 78.3
100.0 100.0 100.0

Ejercicios: Para determinar índice de Gini

1. Dado el tablero incompleto de la distribución de frecuencias de los salarios en soles de 25


trabajadores, con un ancho de clase constante igual a s/. 500

SALARIO xi fi Fi hi%
3
28%
3000 8

2
4%

49
Docente: Gilbert Chua

2. Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200 familias

INGRESO S./ fi Fi
35
240
45 120
157
280
20

3. Dada la siguiente distribución de frecuencias acerca de los sueldos diarios en soles, de los
obreros de la empresa el Sol, donde h2=h3.

Li Ls fi hi Hi
15 0.25

25 0.65

40
0.15

4. La tabla muestra la distribución del ingreso familiar correspondiente a 80 familias

INGRESO S/. fi Fi hi
170
48 60
0.125
200 0.075

5. Dado el siguiente cuadro de frecuencias, acerca del ingreso de funcionarios de una


institución estatal.

INGRESO S/. hi fi
1/k k
1100 2/k
9/k
1700 3/k

50
Docente: Gilbert Chua

TRABAJO ENCARGADO

1) Anotar 7 ejemplos de variables

a) Cualitativos b) Discretos c) Continuos (2ptos)

2) la distribución de los alumnos de dos secciones según el puntaje de


un examen de Estadística, fue: (4ptos)

Alumnos por
secciones
Puntaje A B
35 – 45 4 3
45 – 55 12 14
55 – 65 20 18
65 – 75 15 18
75 – 85 9 20
85 – 95 2 2

Calcular e interpretar:

a) Puntajes promedios
b) Puntajes medianos
c) Puntaje modal
d) Desviación Estándar
e) Analizar comparativamente y determinar que sección presenta mejores
rendimientos y es más homogéneo.
f) Que puntaje tiene el 25% de los mejores alumnos.

3) Para una muestra de 60 catedráticos de una Universidad y 40 de


una Particular, se obtuvo la siguiente distribución de sueldos:
(5ptos)

Sueldo Univ. Univ.


(US $) Nac. Part.
101 – 150 5 -
151 – 200 10 3
201 – 300 16 5
301 – 400 17 8
401 – 500 7 10
501 – 600 5 6
601 – 700 - 5
701 – 800 - 3

51
Docente: Gilbert Chua

a) Analizar comparativamente los niveles de los sueldos


b) En qué Universidad los sueldos son más homogéneos
c) Cual es el sueldo promedio y mediano general de los 100 catedráticos
d) Calcular la desviación estándar para los 100 catedráticos y que indica
e) Se propone la siguiente política: incremento del 10% sobre el ingreso que
vienen percibiendo; sin embargo el sindica de docentes propone lo siguiente:
que el 5% menos del salario anterior más $50 para ambas universidades.
f) Indicar cual de las propuestas benefician mejor al docente.
Para ambas universidades.

4) Se tiene una distribución de frecuencias con 5 intervalos de clase,


cuyo ancho es constante y representa a una variable continua,
además: (3ptos)

n=50 hi= h2=0.1 f4=20 H3=0.4 mediana=23.75


moda=25

Determine el cuadro completo de distribución de frecuencias.

5) Calcular la media aritmética, sabiendo que la moda es 33 y la


mediana 33.5 y pertenece al tercer intervalo (3ptos)

Intervalos fi
5 15 a
15 25 2m
25 35 10
35 45 3m
45 55 2a

6) Calcular el valor de n sabiendo que la mediana vale 61.666 y


pertenece al quinto intervalo (3ptos)

Intervalos fi
20 30 3
30 40 1
40 50 2
50 60 6
60 70 n

52
Docente: Gilbert Chua

PROBABILIDADES

53
Docente: Gilbert Chua

PROBABILIDAD

Mientras que la Estadística se puede describir como la ciencia y el arte de recopilar, resumir y
analizar datos e inferir, estimar y proyectar valores y consecuencias a partir de estos
elementos, la probabilidad se pude definir como el estudio de fenómenos o experimentos
puramente “aleatorios” o libres de determinación. En el estudio de la probabilidad interesa
deducir las leyes del azar y los resultados que estos determinan.

Históricamente la probabilidad se inicia con el estudio de los juegos al azar, tales como la ruleta
y las cartas; frecuentemente se usa el término probabilidad para sugerir que existe duda o
incertidumbre sobre lo que ocurrió, lo que ocurrirá.

Permanentemente interesa predecir o estimar lo que sucederá en ciertas circunstancias


por ejemplo:

- Un empresario puede decidir la comercialización de un producto si se conoce que la


probabilidad de éxito es muy alta.
- El agricultor no sembrara demasiadas hectáreas de café si la probabilidad de que baje el
precio es muy elevada.

 EXPERIMENTO ALEATORIO: Un experimento es aleatorio, cuando los resultados de la


observación no se pude predecir con exactitud, porque presenta varias posibilidades.

Ejm: - Se lanza un dado y se observa el numero que aparece en la cara superior


- Arrojar una moneda y observar el resultado.
- El monto de la venta de un día en una tienda.
- Elegir un delegado de una sección de 40 alumnos, etc.

 ESPACIO MUESTRAL: Es el conjunto de todos los resultados posibles de un


experimento dado; denotado por la letra “  ”.

Ejm: - Lanzamiento de un dado.  = {1, 2, 3, 4, 5, 6}


- Al lanzar una moneda.  = {Cara, Sello}

 SUCESO O EVENTO: Suceso es simplemente un subconjunto de resultados


posibles, en otras palabras suceso es un subconjunto del espacio muestral  ,
es decir, si A es un suceso, entonces A   .

Ejem:

Experimento: Se lanza un dado y se observa el número que aparece en la cara


superior.
Espacio muestral:  = {1, 2, 3, 4, 5, 6}
Evento: A: Obtener el numero 3, es decir A= {3}

Experimento: Arrojar una moneda y obtener el resultado.


Espacio muestral:  = {C, S}
Evento: A: Obtener cara, es decir A= {C}

Experimento: Asistieron 500 clientes a un banco.


Espacio muestral:  = {500}
Evento: A: Elegir un cliente, es decir A= {1}

54
Docente: Gilbert Chua

 PROBABILIDAD DE OCURRENCIA DE UN EVENTO:

Sea “S” el espacio muestral de “m “eventos sencillos equiprobables y sea “A “un


suceso especifico contenido en “S” se verifica que:

n( A)
p( A) 
n()

Donde: n (A): Es el número de elementos favorables al suceso A


n (S): Es el número de elementos del espacio muestral.
P (A): Es la probabilidad de ocurrencia del suceso A

 AXIOMAS DE PROBABILIDAD

Para un evento A se cumple que: 0≤ P(A) ≤1

- Para un evento seguro se cumple que P (Ω)=1

- Para un evento imposible se cumple que P (Φ)=0

Para un evento complementario se cumple que P (A C)=1-P(A)

Ejercicios: Para hallar probabilidades

1. Si se lanza un dado: hallar la probabilidad de obtener:

a) Un valor impar
b) Un valor mayor a 4
c) Un valor negativo

Desarrollo:

Espacio muestral  = {1, 2, 3, 4, 5, 6} → n (Ω)=6

- Evento: obtener un valor impar A= {1, 3, 5} → n (A)=3

Luego:
n( A) 3
p( A)    0.5 x100  50%
n() 6

Entonces la probabilidad de obtener un valor impar al lanzar un dado es del


50%
- Evento: obtener un valor mayor a 4 B= {5, 6} → n (B)=2

Luego:
n( B ) 2
p( B)    0.333x100  33.3%
n() 6
Entonces la probabilidad de obtener un valor mayor a 4 es del 33.3%

55
Docente: Gilbert Chua

- Evento: obtener un valor negativo C= { } → n (C)=0

Luego:
n(C ) 0
p(C )   
n() 6

Entonces la probabilidad de obtener un valor negativo es nula

2. Si se lanza dos dados: hallar la probabilidad de obtener:

a) 8 como suma de los puntajes.


b) La suma de sus puntos sea mayor o igual a 10.
c) Los dos puntos sean par.

1,1 1,2 1,3 1,4 1,5 1,6


2,1 2,2 2,3 2,4 2,5 2,6
3,1 3,2 3,3 3,4 3,5 3,6
Ω 4,1 4,2 4,3 4,4 4,5 4,6
n(Ω)=36

5,1 5,2 5,3 5,4 5,5 5,6


6,1 6,2 6,3 6,4 6,5 6,6

a) 8 como suma de los puntajes A= {2,6; 3,5; 4,4; 5,3; 6,2 } → n (A)=5

n( A) 5
p( A)    0.139 x100  13.9%
n() 36

b) La suma de sus puntos sea mayor o igual a 10

B= {4,6; 5,5; 5,6; 6,4; 6,5; 6,6} → n (B)=6

n( B ) 6
p( A)    0.167 x100  16.7%
n() 36

c) Los dos puntos sean par.

C= {2,2; 2,4; 2,6; 4,2; 4,4; 4,6; 6,2; 6,4; 6,6} → n (C)=9

n(C ) 9
p(C )    0.25 x100  25%
n() 36

56
Docente: Gilbert Chua

3. ¿Cuál es la probabilidad de que al lanzar dos monedas se obtenga el mismo


resultado?

 = {CC, CS, SC, SS,} → n (Ω)=4

- Evento: obtener un valor impar A= {CC, SS} → n (A)=2

Luego:
n( A) 2
p( A)    0.5 x100  50%
n() 4

Ejercicios: Para determinar probabilidad

1. Calcular la probabilidad de obtener al menos una cara en el lanzamiento de 3


monedas.

2 . Una bola se extrae aleatoriamente de una urna que contiene 3 bolas rojas y 2
azules, si se extrae una bola ¿Cuál es la probabilidad de que la bola sea de color
roja y cual es la probabilidad de que sea de color azul?

3 . Una urna tiene ocho bolas rojas, cinco amarillas y siete verdes. Si se extrae una
bola al azar, que probabilidades hay de que:

 Operaciones con sucesos

Los eventos son conjuntos, en consecuencia se puede combinar sucesos para


formar nuevos sucesos, para el efecto se realizan diferentes operaciones con
conjuntos.

i. AUB (A unión B), es el suceso que ocurre si y solo si A o B o ambos


ocurren. Y se denota por la letra “o”

57
Docente: Gilbert Chua

ii. A B (A intersección B), es el suceso que ocurre si y solo si A y B


suceden simultáneamente. Y se denota por la letra “y”

iii. Ā (Complemento de A o también no A), es el suceso que ocurre si


y solo si A no ocurre. Y se denota por “negación”

Ejemplo:

Sean los sucesos:

S= {Población de 10 a 19 años de edad}


A= {Población de 10 a 19 años que estudian}
B= {Población de 10 a 19 años que trabajan}

AUB: Población de 10 a 19 años que estudian o que trabajan


AB: Población de 10 a 19 años que estudian y trabajan
Ā: Población de 10 a 19 años que no estudian
A  B : Población de 10 a 19 años que no estudian ni trabajan.

58
Docente: Gilbert Chua

Ejercicios:

1. En una competencia atlética entre MNP, determinar la probabilidad de que:

- Gana M
- No gane P
- M le gana a N
- M o P ganan la competencia
- N quede en 2do lugar

2. En un experimento de lanzar 2 monedas y un dado, se observa los siguientes sucesos


o eventos:

A. Que aparezca 2 caras y un número par


B. Que aparezca un 2
C. Que aparezca una cara, sello y número par

Determinar la probabilidad de que:


- A y B Sucedan
- B o C sucedan
- Que no ocurra C
- B y C no ocurran
- A o C no sucedan

3. De cinco dirigentes A, B, C, D, E, se elige una comisión de tres miembros, determinar


la probabilidad de que:

A sea integrante de la comisión


A o B sean seleccionados
A y B sean seleccionados
A no sea seleccionado

 Eventos mutuamente excluyentes y regla de adición

Dos sucesos cualesquiera A y B se dice que son MUTUAMENTE EXCLUYENTES si


y solo si A  B   Es decir, son sucesos que no tiene elementos comunes. Son
conjuntos disjuntos.

Ejemplo: Dada la población de:

A= {Ingenieros} B= {Analfabetos}

59
Docente: Gilbert Chua

Luego se cumple que A  B   por que no hay ingenieros que sean analfabetos

Por lo tanto, cuando ambos no pueden ocurrir a la vez A  B   , entonces se


cumple:
P( A o B)  P( A)  P( B) : Probabilidad de que ocurra A o B

Por tanto:
P( A  B)  P( A)  P( B)

Ejercicios:

1. Una caja contiene 220 tornillos iguales, de los cuales 80 son producidos por la
maquina A, 60 por la maquina B, ¿50 por la maquina C y 30 por la maquina
D. sí se elige un tornillo al azar de la caja, cual es la probabilidad que el
tornillo elegido haya sido producido por las maquinas A o C?
Es claro que A, B, C y D son sucesos mutuamente excluyentes, porque cada
tornillo es producido por una y solo una maquina.

2. Se lanza un dado dos veces. Sean los eventos:

A. En los 2 lanzamientos se obtiene el mismo número


B. En el primer lanzamiento se obtiene valor impar y en el segundo se
obtenga un 2

Hallar la probabilidad de que A y B sucedan;


Hallar la probabilidad de que A o B sucedan

3. Una bola se extrae al azar de una caja que contiene 4 bolas blancas, 5 bolas
rojas y 2 azules. Determinar la probabilidad de que sea azul o roja; queda
claro que la bola sea azul y roja a la vez (eventos mutuamente excluyentes)

 Eventos no excluyentes y regla de adición modificada

Cuando dos eventos A y B no son MUTUAMENTE EXCLUYENTES, es decir que


pueden ocurrir el uno y el otro, por tanto son eventos cualesquiera, se cumple
que:

P( A  B)  P( A)  P( B)  P( A  B)

Ejemplo:

En una clase de 20 alumnos, 8 llevan matemática y 12 estadística; además 4


llevan matemáticas y estadística juntos, si escogemos a un alumno de clase
¿Cuál es la probabilidad de que lleven matemáticas o estadística?

60
Docente: Gilbert Chua

P( A  B)  P( A)  P( B)  P( A  B)
8 12 4
P( A  B)     0.8 x100
20 20 20
P( A  B)  80%

Ejercicios:

1. La probabilidad de que Angélica no estudie ingles es 0.25 y la probabilidad de


que estudie francés es 0.5. si la probabilidad de que no estudie ingles o
francés es 0.15, ¿Cuál es la probabilidad de que estudie ambos a la vez?

2. Se lanza 2 dados comunes uno negro y el otro rojo. Calcule la probabilidad de


obtener un número mayor que 4 en el dado negro o un número menor que 3
en el dado rojo.

3. En una empresa comercial trabajan 8 hombres y 18 mujeres, e las cuales la


mitad de los hombres y la mitad de las mujeres han nacido en lima. Hallar la
probabilidad de que un trabajador elegido al azar sea hombre o que haya
nacido en lima.

4. José y María son invitados a una fiesta. La probabilidad de que María asista a
la fiesta es 2/5 y de que juan asista es 3/8.

Si la probabilidad de que al menos uno de los dos asista a la fiesta es ¾,


hallar la probabilidad de que:

a) Solo uno de los dos asista a la fiesta.


b) Ninguno de los dos asista ala fiesta

 Eventos independientes y regla de multiplicación

Sean A y B, se dice que B es independiente de A si la ocurrencia del suceso B no


es influenciado o condicionado por la ocurrencia de A, de modo que:

P( A  B)  P( A)  P( B)
P( A  B  C  ......Z )  P( A)  P( B)  P(C )......P( Z )

Ejemplo:

Se lanza un dado 4 veces ¿Cuál es la probabilidad de obtener cuatro veces en


número 6?

Solución:
Si la probabilidad de obtener un 6 al lanzar un dado es 1/6

61
Docente: Gilbert Chua

Como el lanzamiento de cada dado es independiente entonces la probabilidad


pedida se calcula así:

1 1 1 1 1
P( A  B  C  D)  P( A)  P( B)  P(C )  P( D)  x x x   0.077%
6 6 6 6 1296

Ejercicios:

1. Una urna contiene 2 bolas blancas, 3 rojas y 5 negras. Se extrae


sucesivamente y con devolución tres bolas. Calcular la probabilidad de que las
dos primeras bolas extraídas sean blancas y la tercera negra.

2. Calcular la probabilidad de obtener sello al lanzar una moneda, y un puntaje


impar mayor que 2 al lanzar un dado.

3. La probabilidad de que un comerciante venda pasteles es 1/4 y la probabilidad


de que venda caramelos es 1/3. ¿Cuál es la probabilidad de que…?:

a) Venda pasteles y caramelos


b) Venda pasteles o caramelos
c) No venda pasteles ni caramelos

4. La probabilidad de que un comerciante venda dentro de un mes, un lote de


refrigeradoras es del 30% y la probabilidad de vender un lote de cocinas
dentro de un mes es 35%. Hallar la probabilidad de que:

a) Vende los dos lotes de artículos dentro de un mes


b) Vende “al menos uno” de los lotes dentro de un mes
c) Vende “ninguno” de los lotes dentro de un mes
d) Solamente vende el lote de refrigeradoras dentro de un mes

5. La probabilidad de que juan resuelva un problema es de 2/3 y la probabilidad


de que pedro lo resuelva es 3/4. Si ambos lo intentan independientemente.
¿Cuál es la probabilidad de que el problema sea resuelto?

 Eventos dependientes

Acá el que un evento suceda depende de si el otro ha ocurrido donde, de modo


que la probabilidad de la ocurrencia simultanea para los sucesos A y B es igual a
la probabilidad de ocurrencia de A multiplicada por la probabilidad de ocurrencia
de B, dada que A ha tenido que ocurrir.

P( A  B)  P( A)  P( B / A)
P( A  B  C )  P( A)  P( B / A)  P(C / A  B)

62
Docente: Gilbert Chua

Ejemplo:

En una caja tenemos 6 balotas fáciles, 4 difíciles y 5 regulares. ¿Cuál es la


probabilidad que al sacar 3 balotas (sin reposición), estas sean en el siguiente
orden: fácil, difícil y regular?

Solución:

Primero que 6+4+5=15

P( F  D  R)  P( F )  P( D / F )  P( R / F  D)

6 4 5
P( F  D  R)  x x  4.4%
15 14 13

Ejercicios:

1. En una caja hay 15 fichas, de las cuales 10 están pintadas de rojo y el resto
de blanco. Una persona extrae dos fichas (sin reposición), una por una. Halle
la probabilidad de que ambas sean de color rojo

2. En una caja se tiene 4 bolas azules y 6 bolas blancas. Se extrae 3 bolas al


azar, una por una (sin reposición). Hallar la probabilidad de que la primera
sea blanca, el segundo azul y la tercera blanca.

3. En un lote de 10 artículos hay 3 defectuosos. Si se toma al azar 3 artículos


uno tras otro (sin reposición), ¿Cuál es la probabilidad de que los 3 sean
buenos?

 Evento condicional

Llamaremos así a aquellos casos donde la probabilidad de ciertos eventos


depende o se ven influenciada por la ocurrencia de otros.

Sean A y B dos sucesos tal que P(A) ≠0, se llama probabilidad de B condicionada
a A (P(B/A)); a la probabilidad de B tomando como espacio muestral A; es decir
la probabilidad de que ocurra B dado que ha sucedido A y queda denotado de la
siguiente manera:

P( B  A)
P( B / A) 
P( A)

63
Docente: Gilbert Chua

Ejemplo:

En cierta facultad el 25% de los estudiantes desaprobó matemáticas, el 15%


desaprobó estadística y el 10% desaprobaron las dos asignaturas. Si se
selecciona un estudiante al azar:

a) Si desaprobó estadística, ¿Cuál es la probabilidad de que desaprobara


matemáticas?
b) Si desaprobó matemáticas, ¿Cuál es la probabilidad de que desaprobara
estadística?
c) ¿cual es la probabilidad de que desaprobara matemáticas o estadística?

Solución:

a) La probabilidad que el estudiante desaprobara matemáticas dado que


desaprobó estadística será:

P( M  E ) 0.10
P( M / E )    66.67%
P( E ) 0.15

b) La probabilidad que el estudiante elegido desaprobara estadística, dado


que haya desaprobado matemáticas, es:

P( E  M ) 0.10
P( E / M )    40%
P( M ) 0.25

c) Que desaprobara matemáticas o estadística, será:

P( M  E )  P( M )  P( E )  P( M  E )
P( M  E )  0.25  0.15  0.1  0.3 x100
P( M  E )  30%
Ejercicios:

1. La dirección de transito hizo un estudio sobre los accidentes y encontró que el


78% de los accidentes son de noche; que el 64% es por que los conductores
están ebrios y el 25% de los accidentes son de noche estando los conductores
ebrios. Se pide calcular:

a) Cual es la probabilidad de que un accidente haya sucedido de noche dado


que el conductor estuvo ebrio.

b) Cual es la probabilidad de que un accidente ocurra cuando el chofer este


ebrio dado que sucedió de noche.

64
Docente: Gilbert Chua

2. Una persona lanza una moneda 3 veces ¿Cuál es la probabilidad de obtener 3


caras dado que salió por lo menos una cara?

3. Dado el siguiente diagrama:

Ojos azules Ojos negros


TOTAL
(A) (N)
Varones (V) 15 35 50
Mujeres (M) 18 45 63
TOTAL 33 80 113

Calcular:

a) P(A/M) b) P(M/A) c) P(V/N) d) P(V/A)

18
P( A  M ) 113
a) P( A / M )    28.57%
P( M ) 63
113

4. La siguiente tabla presenta la clasificación de 356 estudiantes de una


Universidad de Lima, de acuerdo a su especialidad y procedencia.

Especialidad
Procedencia TOTAL
Ing. Industrial Administración Economía Derecho
Limeño 100 40 50 20 210
Provinciano 20 60 50 10 140
Extranjero 5 0 1 0 6
TOTAL 125 100 101 30 356

a) ¿Cual es la probabilidad de que el estudiante no pertenezca a la


facultad de Ing. Industrial y no sea extranjero?

b) ¿Cuál es la probabilidad de que el estudiante no pertenezca a la


facultad de Ing. Industrial dado que es limeño?

c) ¿Cuál es la probabilidad de que el estudiante no pertenezca a la


facultad de Economía o de administración dado que es provinciano?

65
Docente: Gilbert Chua

 Teorema de Bayes

El teorema de Bayes lleva este nombre porque fue enunciado por el ministro
plebisteriano Thomas Bayes (1702 – 1761) matemático de nacionalidad inglesa.
El expresa que se puede determinar la probabilidad de las causas a partir de los
efectos que han podido ser observados. Sean: A1; A2; A3;…..;An; los sucesos que
cumplen las características de una probabilidad total y sea B un suceso
cualquiera del que se conoce las probabilidades condicionales P(B/A i) entonces la
probabilidad P(Ai/B) viene dada por la expresión:

P( Ai )  P( B / Ai )
P( Ai / B) 
P( A1 )  P( B / A1 )  P( A2 )  P( B / A2 )  ...  P( An )  P( B / An )

También podemos expresar esta probabilidad como:

P( Ai )  P( B / Ai )
P( Ai / B)  n
; i  1; 2; 3;...; n
 P( A )  P( B / A )
i 1
i i

Ejemplo:

Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1
negra y C con 2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos
una bola. Si la bola ha sido roja, ¿cuál es la probabilidad de haber sido extraída
de la urna A?

Solución:

Llamamos

R= "sacar bola roja" y


N= "sacar bola negra".

En el diagrama de árbol adjunto pueden verse las distintas probabilidades de


ocurrencia de los sucesos R o N para cada
una de las tres urnas.

La probabilidad pedida es P(A/R). Utilizando el teorema de Bayes, tenemos:

66
Docente: Gilbert Chua

P( A)  P( R / A)
P( A / R) 
P( A)  P( R / A)  P( B)  P( R / B)  P(C )  P( R / C )

1 3
x
3 8 45
P( A / R)    26%
1 3 1 2 1 2 175
x  x  x
3 8 3 3 3 5

Ejercicios:

1. En la empresa “Alimentos Mr Pollo” el 20% de los empleados son ingenieros y


otro 20% son economistas. El 75% de los ingenieros ocupan un cargo
directivo y el 50% de los economistas también, mientras que los demás
trabajadores (no ingenieros y no economistas) solamente el 20% ocupa un
puesto directivo. ¿Cuál es la probabilidad de que un empleado directivo
elegido al azar sea ingeniero?

2. La probabilidad de que haya un accidente en una fábrica que dispone de


alarma es 0.1. La probabilidad de que suene esta sí se ha producido algún
incidente es de 0.97 y la probabilidad de que suene si no ha sucedido ningún
incidente es 0.02.

En el supuesto de que haya funcionado la alarma, ¿cuál es la probabilidad de


que no haya habido ningún incidente?

3. Una persona puede viajar de 3 formas, bicicleta, auto y avión. Cada forma de
transporte tiene una probabilidad de tener un defecto en el sistema de rodado
y no llegar al destino del 3%, 4% y 5% respectivamente.

Para escoger el método de traslado se tienen 3 fichas, las cuales tienen una
probabilidad de aparecer del 50%, 30% y 20% respectivamente. Si se toma
un viaje al azar, y no llega a destino, hallar la probabilidad de que ese viaje se
realizó en bicicleta.

4. En un centro escolar los alumnos pueden optar por cursar como lengua
extranjera inglés o francés. En un determinado curso, el 90% de los alumnos
estudia inglés y el resto francés. El 30% de los que estudian inglés son chicos
y de los que estudian francés son chicos el 40%. El elegido un alumno al azar,
¿cuál es la probabilidad de que sea chica?

67
Docente: Gilbert Chua

VARIABLES ALEATORIAS
Una variable aleatoria es una variable que toma valores numéricos determinados por el
resultado de un experimento aleatorio. No hay que confundir la variable aleatoria con
sus posibles valores. Ejemplos:

- nº de caras al lanzar 6 veces una moneda (valores: 0, 1, 2…)


- nº de llamadas que recibe un teléfono en una hora
- tiempo que esperan los clientes para pagar en un supermercado…

Las variables aleatorias pueden ser discretas o continuas:

- Discretas: el conjunto de posibles valores es numerable. Suelen estar asociadas


a experimentos en que se mide el número de veces que sucede algo.

- Continuas: el conjunto de posibles valores es no numerable. Puede tomar todos


los valores de un intervalo. Son el resultado de medir.

Función de distribución
D iscreta P(X=x)
Altu ra
Variable probabilidad
aleatoria X
X Función densidad
f(x)=P(a<X<b)
Continua Area
densidad

Variable aleatoria discreta

Si la variable aleatoria es discreta la describimos según su distribución de


probabilidades, que consiste en una lista de valores posibles de la variable y la
proporción de veces que esperamos que ocurran:

x x1 x2 ... xk
P(x) p1 p2 ... pk

Ejemplo:

Clasificar como discretas o continuas las siguientes variables aleatorias:

a) nº de páginas de un libro → discreta


b) tiempo que tarda en fundirse una bombilla → continua
c) nº de preguntas en una clase de una hora → discreta
d) cantidad de agua consumida en un mes → continua

En la práctica se consideran discretas aquellas variables para las que merece la pena
asignar probabilidades a todos los posibles sucesos elementales.

68
Docente: Gilbert Chua

Distribución de una variable aleatoria

Sea x una variable aleatoria discreta. Su distribución viene dada por los valores que
puede tomar, x1, x2, x3,…, xk, y las probabilidades de que aparezcan p1, p2, p3,…, pk.
Estas cantidades pi  P{x  xi } reciben el nombre de función de probabilidad o
función de masa.

Ejemplo:

Variable aleatoria x=nº de caras al lanzar tres veces una moneda

El espacio muestral que corresponde a este experimento es:

S= {ccc, ccs, css, csc, sss, ssc, scc, scs}

Sea X = número de caras, ¿qué valores puede tomar la variable X?


Espacio Muestral Variable aleatoria X
sss x1 = 0
css, ssc, scs x2 = 1
ccs, csc, scc x3 = 2
ccc x4 = 3

Posibles valores de x: 0, 1, 2 y 3

x 0 1 2 3
p(x) 1 3 3 1
8 8 8 8

La función de probabilidad es:

p0  P{x  0}  1 / 8  0,125

p1  P{x  1}  3 / 8  0,375

p2  P{x  2}  3 / 8  0,375

p3  P{x  3}  1 / 8  0,125
Graficando la Función de probabilidad de x:

69
Docente: Gilbert Chua

0.40

0.35

0.30

0.25

0.20

0.15

0.10
0 1 2 3

¿Cuál será la probabilidad de que salgan al menos dos caras?

P{x  2}  P{x  0}  P{x  1}  P{x  2}  0,125  0,375  0,375


 0,875

¿y la probabilidad de que el número de caras esté entre 1 y 2?

P{1  x  2}  P{x  1}  P{x  2}  0,375  0,375  0,75

La función de distribución o de probabilidad acumulada representa en cada punto x0 la


probabilidad de que la variable tome un valor menor o igual que dicho punto, es decir,
P{x  x0}.

Ejemplo: nº caras al lanzar tres veces una moneda

P{x  0}  P{x  0}  0,125

P{x  1}  P{x  0}  P{x  1}  0,125  0,375  0,5

P{x  2}  P{x  0}  P{x  1}  P{x  2}  0,5  0,375  0,875

P{x  3}  P{x  0}  P{x  1}  P{x  2}  P{x  3}  0,875  0,125  1

Función de distribución de x

1.0

0.8

0.6

0.4

0.2

0.0
0 1 2 3

70
Docente: Gilbert Chua

Media o esperanza matemática y varianza y de una variable aleatoria

Si X es una variable aleatoria discreta que toma valores x1, x2, ... xk, con probabilidad p1,
p2,... pk, entonces la media o el valor esperado de X está dado por:

E ( X )   X  x1 p1  x2 p2    xk pk

k
E ( X )   xi p i
i 1

la varianza de X está dada por:



Var( X )   x2  E  X   
2

Var( X )   xi2 pi   2

y la desviación estándar de X está dada por:

 x   x2

En el caso del número de caras al lanzar 3 monedas, la distribución de probabilidades


de X es:

x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8

1 3 3 1
La media de X es: E ( X )   X  0  1  2  3
8 8 8 8

3 6 3 12
E( X )  0      1,5 caras
8 8 8 8

 1  2 2  32  1,5
1 23 3 1
Var ( X )  0 2
2

8 8 8 8

   1,5
3 12 9
Var ( X )  0 
2

8 8 8

24
Var ( X )   2,25  0,75
8

y la desviación estándar de X es :  x  0,75  0,866 caras

Sea X una variable aleatoria que representa el número de libros que llevan en la mochila
los estudiantes de esta universidad:

71
Docente: Gilbert Chua

x 0 1 2 3
P(x) 0,5 0,2 0,2 0,1

a) Describa la forma de la distribución


b) ¿Qué proporción de estudiantes llevan 3 o menos libros ( X  3 )?
c) ¿Qué proporción de estudiantes llevan más de 2 libros ( X  2 )?
d) ¿Qué proporción de estudiantes llevan entre 2 y 3 libros ( 2  X  3 )?
e) ¿Qué proporción de estudiantes llevan entre 1 y 2 libros (1  X  2 )?
f) Hallar la media y desviación estándar

Ejercicio
Sea x una variable aleatoria que expresa el nº de personas que habitan en una vivienda
elegida al azar. La distribución de probabilidad de x es la siguiente:

xi 1 2 3 4 5 6 7 8ó+
pi 0,230 0,322 0,177 0,155 0,067 0,024 0,015 0,010

a) Hallar la probabilidad de que el nº de personas que viven en un hogar sea menor


o igual que cuatro.

b) Calcular la probabilidad de que al menos dos personas vivan en una vivienda.

c) Obtener el nº medio de personas que habitan en una vivienda y su desviación


estándar

Un miembro del consejo de Administración de una empresa ha comprobado que, si bien


tofos los años tienen una junta, ha habido años que tienen hasta cinco. Por la
experiencia acumulada durante años sabe que el número de juntas anual se distribuye
con arreglo a la siguiente tabla:

Nº de juntas al año 1 2 3 4 5
Probabilidad 2/15 5/15 1/15 3/15 4/15

a) Calcular la media
b) Calcular la varianza y la desviación típica
c) Probabilidad de que en un año elegido al azar se celebren más de 3 juntas

72
Docente: Gilbert Chua

73
Docente: Gilbert Chua

74
Docente: Gilbert Chua

75
Docente: Gilbert Chua

Ejemplo:

Sea x una V.A continua con función de densidad:

a(3x  x 2 ) si 0  x  3
f ( x)  
0 en otros casos

 Hallar el coeficiente a
 Graficar la función de densidad
 Hallar la probabilidad de que x se encuentre en el intervalo [1,2]
 Hallar la media, varianza y desviación estándar

Desarrollo:

76
Docente: Gilbert Chua

3
 a(3x  x )dx  1
2
0
3
 3x 2 x3 
a   1
 2 3 0
 3(3) 2 (3)3   3(0) 2 (0)3 
a    1
3   2 3 
a)
 2
 27 
a   9  1
2 
2
a
9

Por tanto, la función es:

2 2 2 2
 (3 x  x ) si 0  x  3  x x si 0  x  3
2
f ( x)   9 f ( x)   3 9
0 en otros casos 0 en otros casos

Graficando la función:

Y X
0 0.000
1 0.444
5 0.500
2 0.444
3 0.000

b) P (1 ≤ x ≤ 2)

2 2 2
p(1  x  2)   ( x  x 2 )dx
1 3 9
2
 2 x 2 2 x 3   2(2) 2 2(2)3   2(1) 2 2(1)3 
p(1  x  2)       
 6 27 1  6 27   6 27 
p(1  x  2)  0,4815
p(1  x  2)  48,15%

77
Docente: Gilbert Chua

Hallando la media o esperanza matemática


  E( x)   xf ( x)dx


2 2
E ( x)   x( x  x 2 )dx
3

0 3 9
3 2 2
E ( x)   ( x 2  x 3 )dx
0 3 9
3
2 2 
E ( x)   x 3  x 4 
9 36  0
2 2  2 2 
E ( x)   (3)3  (3) 4    (0)3  (0) 4 
9 36  9 36 
3
E ( x)   1,5
2

Hallando la varianza

 2  E ( x 2 )  E ( x)2 ; desarrollando primero E(x2)

3 2 2
E ( x 2 )   x 2 ( x  x 2 )dx
0 3 9
3 2 2
E ( x 2 )   ( x 3  x 4 )dx
0 3 9
3
2 2 5
E( x )   x4 
2
x
12 45  0
2 2  2 2 
E ( x 2 )   (3) 4  (3)5    (0) 4  (0)5 
12 45  12 45 
27
E( x2 )   2,7
10

 2  E ( x 2 )  E ( x)2
Reemplazando en la ecuación de la varianza  2  2,7  1,52
 2  0,45

Calculando la desviación estándar

 2  0,45
  0,45  0,67082

78
Docente: Gilbert Chua

Ejercicios:

1) El Dr. Pérez, un empresario de la Inca-Kola quiere hallar la función de densidad


para x (cantidad de gaseosas por botella en onzas) que es cuadrática por
naturaleza. El determina que sería de la forma:

k ( x 2  32 x  5) si 15  x  17
f ( x)  
0 en otros casos

 Hallar el coeficiente k
 Graficar la función de densidad
 Hallar la probabilidad de que x se encuentre en el intervalo [15,16]
 Hallar la media, varianza y desviación estándar

2) En un hospital se comprobó que el peso en kilos de los niños al nacer era una
V.A con función de densidad:

kx si 2  x  4
f ( x)  
0 en otros casos

 Hallar el coeficiente k
 Graficar la función de densidad
 Hallar la probabilidad de que x se encuentre entre 2 y 3,4 kilogramos
 Hallar la media, varianza y desviación estándar

3) Un agricultor encuentra que el peso de sandía es una variable aleatoria x con


fusión de densidad:

 3
 ( x 2  12 x  20) si 2  x  10
f ( x)   256
0 en otros casos
 Graficar la función de densidad
 Hallar la probabilidad de que una sandía pese menos de 5 kilogramos
 Hallar la media, varianza y desviación estándar

79
Docente: Gilbert Chua

MODELOS DE DISTRIBUCIÓN DE PROBABILIDAD

Distribuciones Discretas de Probabilidad

1. Distribución Binomial

Existen muchas situaciones en las que se presenta una experiencia binomial. Este tipo
de experiencias se caracteriza por estar formada por un número predeterminado n de
experimentos iguales. Cada uno de los experimentos es independiente de los restantes
(la probabilidad del resultado de un experimento no depende del resultado del resto). El
resultado de cada experimento ha de admitir sólo dos categorías (a las que se denomina
éxito y fracaso). Las probabilidades de ambas posibilidades han de ser constantes en
todos los experimentos (se denotan como p y q o p y 1-p).

Se designa por X a la variable que mide el número de éxitos que se han producido en los
n experimentos.

Cuando se dan estas circunstancias, se dice que la variable X sigue una distribución de
probabilidad binomial, y se nota B(n,p).

Características analíticas

Su función de probabilidad está dada por:

donde

, siendo las combinaciones de en ( elementos


tomados de en )

Parámetros de la distribución
Si tenemos una distribución Binomial de parámetro n y p se verifica que

 Media o esperanza:   np

80
Docente: Gilbert Chua

 Varianza:  2  np(1  p)

 Desviación típica:   np(1  p)


Ejemplo

Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las cuales
tiene 4 respuestas y solo una de ellas correcta. Un alumno tiene prisa por acabar la
prueba y decide contestar aleatoriamente. Se pide

a) Probabilidad de acertar exactamente 4 preguntas


b) Probabilidad de no acertar ninguna
c) Probabilidad de acertar todas
d) Probabilidad de acertar al menos 8
e) Probabilidad de acertar a lo sumo 6
f) Media y varianza

Solución
Consideremos los sucesos
A = Contestar bien P (A) = 0.25
A = No contestar bien P ( A ) = 0.75
Se trata de una distribución Binomial de parámetros B (10, 0.25 )
Sea X la variable aleatoria que representa el número de preguntas contestadas
correctamente

10 
a) P(acertar 4) = PX  4   (0.25) 4 (0.75)6  0.1460
4
10 
b) P (no acertar ninguna) = PX  0   (0.25)0 (0.75)10  0.0563
0
10 
c) P(acertar todas) = PX  10   (0.25)10 (0.75)0  0
10 

d) P(acertar al menos 8) = PX  8  PX  8  PX  9  PX  10 

10  10 
  (0.25)8 (0.75) 2   (0.25)9 (0.75)  0  0.005
8 9

81
Docente: Gilbert Chua

e) P( acertar a lo sumo 3) =
P X  3  PX  0  PX  1  PX  2  PX  3 

10  10  10  10 


  (0.25)0 (0.75)10   (0.25)1 (0.75)9   (0.25) 2 (0.75)8   (0.25)3 (0.75)7  0.7759
0 1 2 3

f) Media y Varianza
  np  10  (0.25)  2.5
 2  np(1  p)  10(0.25)(0.75)  1.875

Ejercicio 1:

La probabilidad de que un estudiante obtenga el título de Ingeniero Comercial es de 0.3.


Halla la probabilidad de que de un grupo de siete estudiantes matriculados en primer
curso:

a) Ninguno de los 7 finalice la carrera


b) Finalicen todos la carrera
c) Al menos 2 acaben la carrera
d) Halla la media y la desviación típica

Ejercicio 2
En un estudio socioeconómico se ha determinado que las condiciones socioeconómicas
del 35% de la población de un distrito de Moquegua son inaceptables. Elegida una
muestra de esa población formada por 9 individuos, calcular:

a) Probabilidad de que solo vivan 3 en condiciones inaceptables


b) Hallar la media y la varianza de la distribución

Distribución de Poisson

Esta distribución se presenta cuando los “éxitos” (que son elementos ó sucesos que
suelen ser expresados por unidad de área ó unidad de tiempo respectivamente) llegan a
satisfacer las siguientes características:

82
Docente: Gilbert Chua

1. La presencia de un “éxito” en una unidad no influye (no afecta) la presencia de


otro “éxito” en otra unidad.
2. La probabilidad de hallar un “éxito” en una unidad es proporcional al tamaño de
la unidad.
3. Es posible hallar muchos “éxitos” en una unidad.

Sea λ el promedio de “éxitos” por unidad. La probabilidad de hallar exactamente x


“éxitos” en una unidad cualquiera es

e   x
f ( x)  x  0,1,...
x!
Con media y varianza:

  np
    np
Ejemplo:
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las
probabilidades de que reciba,

a) cuatro cheques sin fondo en un día dado,


b) 10 cheques sin fondos en cualquiera de dos días consecutivos?

83
Docente: Gilbert Chua

Ejercicio
Una compañía aérea observa que el número de componentes que fallan antes de cumplir
100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número
promedio de fallos es ocho. Se pide:

a) ¿Cuál es la probabilidad de que falle un componente en 25 horas?


b) ¿Cuál es la probabilidad de que fallen menos de dos componentes en 50 horas?
c) ¿Cuál es la probabilidad de que fallen por lo menos tres componentes en 125 horas?

84
Docente: Gilbert Chua

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

85
Docente: Gilbert Chua

86
Docente: Gilbert Chua

87
Docente: Gilbert Chua

88
Docente: Gilbert Chua

89
Docente: Gilbert Chua

90
Docente: Gilbert Chua

91
Docente: Gilbert Chua

92
Docente: Gilbert Chua

EJERCICIOS: Hallar
1) P (3,01≤ Z ≤3,62)
2) P (1,84≤ Z ≤1,96)
3) P (-2,36≤ Z ≤-1,43)
4) P (-1,75≤ Z ≤-0,45)
5) P (Z > 2,03)
6) P (Z <-2,33)

93
Docente: Gilbert Chua

94

También podría gustarte