0% encontró este documento útil (0 votos)
133 vistas229 páginas

Estadistica Clases 2021

El documento presenta las políticas y evaluaciones de un curso. Establece que los estudiantes pueden llegar hasta 10 minutos tarde, prohíbe el uso de celulares y gorras en clase, y requiere que las exposiciones sean profesionales con diapositivas. Detalla las evaluaciones que incluyen exposiciones, talleres, avances de proyectos y lecturas. El proyecto final debe realizarse en equipos sobre un estudio estadístico de percepciones estudiantiles.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
133 vistas229 páginas

Estadistica Clases 2021

El documento presenta las políticas y evaluaciones de un curso. Establece que los estudiantes pueden llegar hasta 10 minutos tarde, prohíbe el uso de celulares y gorras en clase, y requiere que las exposiciones sean profesionales con diapositivas. Detalla las evaluaciones que incluyen exposiciones, talleres, avances de proyectos y lecturas. El proyecto final debe realizarse en equipos sobre un estudio estadístico de percepciones estudiantiles.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPT, PDF, TXT o lee en línea desde Scribd

POLÍTICA DEL CURSO Y EVALUACIÓN A SEGUIR

 Los alumnos pueden entrar hasta 10 minutos después


del inicio de clases, según horario establecido; caso
contrario no podrán ingresar al salón de clases y no se
les pondrá asistencia.
 no celulares en clases, no gorras, no comida.
 Las exposiciones deben ser profesionales: con
diapositivas y vestuario
 Los alumnos deben de conocer y saber la Visión y
Misión del TES.
 Todos los alumnos deben tener su carpeta de Clase.
Contendrá el Sílabo, Copia de las diapositivas de clases,
Talleres, investigaciones, etc.
POLÍTICA DEL CURSO Y EVALUACIÓN A SEGUIR
Primera evaluación Exposiciones 10%
TALLERES/CASOS 25%
avance del proyecto 5%
Lectura del Libro 5%
Actuación en clase 10%
Lecciones 45%
Segunda Evaluación Exposiciones 10%
TALLERES/CASOS 25%
avance del proyecto 5%
Lectura del Libro 5%
Actuación en clase 10%
Lecciones 45%
Tercera evaluación Proyecto Final 100%
Examen Toda la materia 100%
POLÍTICA DEL CURSO Y EVALUACIÓN A SEGUIR
La entrega de los trabajos asignados es puntual, serán
receptados en las fechas señaladas. Cada día que pase
disminuiría un 33,33% su calificación.
Plan Lector. Libro !Bien Hecho¡ , de Ken Blanchard.
Al Inicio de clases se controlará la asistencia del
estudiante.
 Todos Los días, leeremos el significado de un valor
moral.
ESTRUCTURA DEL PROYECTO FINAL DEL CURSO
SE REALIZARA UN PROYECTO FINAL EN EQUIPO DE 5 INTEGRANTES,
EL CUAL CONSISTIRA EN: Realizar un estudio estadístico sobre la
percepción de los estudiantes del TES, respecto al servicio que se ofrece.
Se analizará y aplicará técnicas estadísticas aprendidas en clase.

EL PROYECTO DEBERA INCLUIR:


1.- DESCRIPCION DE LA EMPRESA
[Link] de la empresa.
[Link] que realiza
[Link]ón
[Link] legal
[Link] en el país.
¿Qué es la estadística?

Métodos y procedimientos destinados a recoger,


clasificar, resumir, hallar regularidades, analizar los
datos y realizar inferencias con el fin de ayudar a la
toma de decisiones y en su caso formular
predicciones.
Estadística

Introducción
Etapas de un estudio estadístico

Un análisis estadístico se lleva a cabo siguiendo las etapas habituales en el


llamado método científico cuyas etapas son:

1) Planteamiento del problema: consiste en definir el objetivo de la


investigación y precisar el universo o población.

2) Recogida de la información: consiste en recolectar los datos necesarios


relacionados al problema de investigación.

3) Análisis descriptivo: consiste en resumir los datos disponibles para extraer


la información relevante en el estudio.

4) Inferencia estadística: consiste en suponer un modelo para toda la


población partiendo de los datos analizados para obtener conclusiones
generales.

5) Diagnóstico: consiste en verificar la validez de los supuestos del modelo


que nos han permitido interpretar los datos y llegar a conclusiones sobre la
población
Estadística

Introducción
Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOS

ORGANIZAR Y RESUMIR

Tema de Investigación ESTADÍSTICA DESCRIPTIVA


-Antecedentes Previos (Tablas,
-Objetivos Gráficos, Medidas
-Preguntas de Investigación Descriptivas, etc.)
-Posibles Hipótesis INTERPRETACIÓN
-Unidad de Análisis
-Población Muestra
-Variables ¿Población o Muestra?

INFERENCIA ESTADÍSTICA
Población

CONCLUSIONES

Probabilidad
INFORMACIÓN

12
Estadística

Introducción
Ejemplos de algunos problemas a estudiar

1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de


la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en términos de condiciones


económicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a


vestuario, alimentación, ocio y vivienda.

4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de


distintas empresas del país.

6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una


Universidad, y si éste tiene alguna relación con su edad u otras características.

13
Objetivo de la estadística

•El objetivo de la estadística es mejorar la


comprensión de hechos a partir de datos.
(Moore, p.267)

•El principal objetivo de la estadística es hacer


inferencias acerca de una población, con base en la
información contenida en una muestra. (Pérez, p.172)
Importancia de la estadística

•La estadística resulta fundamental para conocer el comportamiento de


ciertos eventos, por lo que ha adquirido un papel clave en la investigación. Se
usa como un valioso auxiliar y en los diferentes campos del conocimiento y
en las variadas ciencias. Es un lenguaje que permite comunicar información
basada en datos cuantitativos.

•Es tan importante que casi no existe actividad humana en que no esté
involucrada la Estadística. Las decisiones más importantes de nuestra vida
se toman con base en la aplicación de la Estadística. Pongamos algunos
ejemplos.
La estadística es de gran importancia en la investigación científica debido a que:

•Permite una descripción más exacta.


•Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar.
•  Permite resumir los resultados de manera significativa y cómoda.
• Nos permite deducir conclusiones generales.

La evolución de la estadística ha llegado al punto en que su proyección se percibe


en casi todas las áreas de trabajo. También abarca la recolección, presentación y
caracterización de información para ayudar tanto en el análisis e interpretación de
datos como en el proceso de la toma de decisiones. La estadística es parte
esencial de la forma profesional, es hasta cierto punto una parte necesaria para
toda profesión.
• Clasificación de la Estadística 
El estudio de la estadística se divide en dos categorías: la
estadística descriptiva y la estadística inferencial.

•La estadística descriptiva es la que se encarga de recolectar,


describir, organizar y presentar los datos.  Utiliza encuestas,
tablas, gráficas, y desarrolla cálculos que nos explican que
está sucediendo en lo que estamos estudiando.

La estadística descriptiva resume en forma numérica o gráfica


el conjunto de datos que se están analizando.  Si utilizamos
las herramientas y fórmulas de la estadística descriptiva
lograremos describir lo que está sucediendo en la muestra,
NO SE PUEDE GENERALIZAR A LA POBLACIÓN.
• La estadística inferencial, va más allá, es la encargada de
generalizar los datos. Permite hacer conclusiones por lo
que tiene características  inductivas, es decir, que del
estudio que se hace  con una muestra, se puede saber
que va a suceder con toda la población. 

La estadística inferencial permite realizar conclusiones o


inferencias basándose en los resultados obtenidos de una
muestra.  Por ejemplo, a partir de una muestra
representativa tomada de los habitantes de una ciudad, es
posible inferir la votación de todos los ciudadanos
considerando un error de aproximación.
Definición:
• Población

Colección o conjunto de personas, objetos o eventos que


poseen características comunes, cuyas propiedades serán
analizadas.
• Muestra
Subconjunto de la población que comparte una
determinada característica.
• Variable estadística
Información a recopilar, en ella se describen las
características de la muestra. Existen dos tipos:
Cualitativas y Cuantitativas
Estadística

Variable: corresponde a la característica de la Unidad de Análisis

TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo

Toma valores enteros Característica o cualidad


Ejemplos: Número de Hijos, Número de cuyas categorías no tienen
empleados de una empresa, Número de un orden preestablecido.
asignaturas aprobadas en un semestre, etc. Ejemplos: Sexo, Deporte
Favorito, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc. Característica o cualidad cuyas
categorías tienen un orden
preestablecido.
Ejemplos: Calificación (S, N, A);
Grado de Interés por un tema, etc.

21
Unidad de Medida:
Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
EJERCICIOS EN CLASE
Indica que variables son cualitativas y cuales cuantitativas:

1 Comida Favorita. Cualitativa

2 Profesión que te gusta .Cualitativa

3 Número de goles marcados por tu equipo favorito en la última temporada.


Cuantitativa

4 Número de alumnos de tu Instituto .Cuantitativa

5 El color de los ojos de tus compañeros de clase. Cualitativa

6 Coeficiente intelectual de tus compañeros de clase. Cuantitativa


EJERCICIOS EN CLASE
De las siguientes variables indica cuáles son discretas y
cuáles continuas.
1 Número de acciones vendidas cada día en la Bolsa. Discreta

2Temperaturas registradas cada hora en un observatorio. Continua

3 Período de duración de un automóvil. Continua

4 El diámetro de las ruedas de varios coches. Continua

5 Número de hijos de 50 familias. Discreta

6 Censo anual de los españoles. Discreta


EJERCICIOS EN CLASE
Clasificar las
Siguientes variables en cualitativas y cuantitativas discre
tas o continuas.
1 La nacionalidad de una persona. Cualitativa

2 Número de litros de agua contenidos en un depósito. Cuantitativa continua

3 Número de libro en un estante de librería. Cuantitativa discreta

4 Suma de puntos obtenidos en el lanzamiento de un par de dados. Cuantitativa


discreta

5 La profesión de una persona. Cualitativa

6 El área de las distintas baldosas de un edificio. Cuantitativa continua


Estadística
Descriptiva
Objetivos:

• Ordenar y agrupar datos en una tabla.

• Construir histogramas y polígonos de frecuencias,


basados en los datos recopilados.

• Calcular e interpretar las medidas de tendencia central.

• Aplicar la Estadística Descriptiva en la resolución de


problemas de la vida real.

• Analizar gráficos y tablas de datos.


Unidad 2
Distribuciones de frecuencia y
representaciones gráficas
Distribución de frecuencias
Las distribuciones de frecuencias son tablas en que se
dispone las modalidades de la variable por filas. En las
columnas se dispone el número de ocurrencias por cada
valor, porcentajes, etc. La finalidad de las agrupaciones
en frecuencias es facilitar la obtención de la información
que contienen los datos.

Ejemplo: Se quiere conocer si los alumnos de


estadística del TES está a favor o en contra de la
exhibición de imágenes violentas por televisión, para lo
cual vamos a recoger los siguientes datos:
La inspección de los datos originales no permite responder
fácilmente a cuestiones como cuál es la actitud mayoritaria del
grupo, y resulta bastante más difícil determinar la magnitud de
la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los
valores de la variable acompañados del número de veces (la
frecuencia) que aparece cada valor:

X: Símbolo genérico de la variable.


f: Frecuencia (también se simboliza como ni).

Generalmente las tablas incluyen varías columnas con


las frecuencias relativas y acumuladas.
* Existen dos tipos de distribución de frecuencias, con datos
no agrupados y con datos agrupados.

* Rango: Es la diferencia entre el dato mayor y el menor.

Distribución en datos NO agrupados


Se utiliza preferentemente cuando las opciones de la
variable son pocas .
Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente información:
1–6–4–3–1–2–6–5–1–3

Frecuencia: Corresponde a la cantidad de veces


que se encuentra un dato en una muestra.
Rango: 6 – 1 =5
1–6–4–3–1–2–6–5–1–3

Al construir la tabla de frecuencias, se obtiene:

Número Frecuencia
1 3
2 1
3 2
4 1
5 1 Al sumar la columna frecuencia, se
6 2 obtiene el total de datos (n).

Total datos: 10.


EJERCICIOS EN CLASES
* Las edades de veinte chicos son 12, 13, 14, 10, 11, 12, 11,
13, 14, 12, 10, 12, 11, 13, 12, 11, 13, 12, 10 y15. Organiza
los datos en una tabla de frecuencias.
¿Qué porcentaje de chicos tienen 12 años?
¿Cuántos chicos tienen menos de 14 años?
 

* En cada día del mes de enero, en un camping hubo la


siguiente cantidad de turistas: 12, 14, 17, 16, 19, 15, 15, 21,
24, 26, 28, 24, 25, 26, 20, 21, 34, 35, 33, 32, 34, 38, 40, 43,
41, 45, 50, 53, 58. Construye una tabla de frecuencias para
estos datos.
2.2 Distribución en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de
posibilidades, si es cuantitativa continua, debemos agrupar los
datos en intervalos semiabiertos, excepto el último, que es
cerrado.
Al agrupar los datos en intervalos, se debe calcular la
“marca de clase”. Corresponde al promedio entre
los extremos del intervalo.
Ejemplo:

Peso (Kg.) Frecuencia Marca de


clase
[55,59[ 2 57
[59,63[ 5 61
[63,67[ 3 65
[67,71[ 7 69
[71,75] 4 73

A: Amplitud=Longitud del Intervalo


R R: Rango
A= NC NC: Número de Clases
REGLAS GENERALES PARA FORMAS
DISTRIBUCIONES DE FRECUENCIAS PARA DATOS
AGRUPADOS EN INTERVALOS

Cuando los datos contienen una gran cantidad de


elementos, para facilitar los cálculos es necesario
agruparlos, a estos grupos se los llama intervalos o
clases. Un intervalo es una serie de números incluidos
entre dos extremos, así por ejemplo, el intervalo 40 – 45
está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el
límite inferior, 45 el límite superior, 39,5 límite real inferior
(límite inferior disminuido en 5 décimas) y 40,5 el límite
real superior (límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de
frecuencias para datos agrupados en intervalos son:
1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la
diferencia entre el valor mayor y el menor de los datos.

2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5


y mayor de 12, ya que un número mayor o menor de clases podría oscurecer el 
comportamiento de los datos. Para calcular el número de intervalos se aplica la
regla de Sturges:

Siendo n el tamaño de la muestra.


3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo
el Rango para el número de intervalos

Cuando el valor de i no es exacto, se debe redondear al valor superior


más cercano. Esto altera el valor de rango por lo que es necesario
efectuar un ajuste así:
Por ejemplo:
Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se
tiene:
Calculando el Rango se obtiene:

Calculando el número de intervalos se obtiene:

Calculando el ancho se obtiene:

Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene:
El exceso de 3 que se tiene en este caso se distribuye entre xmáx y xmín. Por
lo general se agrega al mayor y se quita al menor. Como por ejemplo, se podría
agregar 2 al valor mayor y quitar 1 al valor menor, obteniéndose los siguientes
nuevos valores:

O también se podría agregar 1 al valor mayor y quitar 2 al valor menor,


obteniéndose los siguientes nuevos valores:

4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada


clase, comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase
(frecuencia absoluta)
6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se
obtiene sumando los límites superior (Ls) e inferior (Li) del intervalo y
dividiendo ésta suma entre 2
EJEMPLO ILUSTRATIVO
A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada (tanto en clase como fuera de ella),
obteniéndose los siguientes resultados:

36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
Distribución de frecuencias (Datos agrupados) para
variables cuantitativas continuas

Para ejemplificar el proceso de construcción de una tabla de


distribución de frecuencias de una variable continua utilizaremos
los datos de las calificaciones obtenidas por 25 estudiantes en un
curso de estadística.

Calificaciones:

9,7.5, 8, 7, 8, 7, 6.3, 9, 6, 5, 8, 8, 6.5, 6,8, 8, 7, 7.4, 7.6,


5.5, 9, 7.2, 9, 7.4, 8.4
Esos datos, dependiendo de
sus características, se pueden
representar en forma gráfica.
Un diagrama de sectores se Diagrama de sectores
puede utilizar para todo tipo
de variables, pero se usa
frecuentemente para las
variables cualitativas.
Los datos se representan
en un círculo, de modo
que el ángulo de cada
sector es proporcional a
la frecuencia absoluta
correspondiente.
Ejemplo

En una clase de 30
alumnos, 12 juegan
a baloncesto, 3
practican la
natación, 4 juegan
al fútbol y el resto
no practica ningún
deporte.
Un diagrama de barras se utiliza para
representar datos cualitativos o datos
cuantitativos de tipo discreto.
Diagrama de barras

Se representan sobre unos ejes de


coordenadas.
En el eje de abscisas se colocan los valores de
la variable, y sobre el eje de ordenadas las
frecuencias absolutas o relativas o
acumuladas.

Los datos se representan mediante barras de una altura proporcional a la frecuencia,


en forma vertical u horizontal.
Ejemplo 1
Un estudio hecho al conjunto de los 20 alumnos de una
clase para determinar su grupo sanguíneo ha dado el
siguiente resultado:
Ejemplo 2
Polígono de frecuencias
Un polígono de frecuencias se forma uniendo
los extremos de las barras de un diagrama de
barras mediante segmentos.

También se puede realizar trazando los


puntos que representan las frecuencias y
uniéndolos mediante segmentos.
Ejemplo 1
Ejemplo 2

Las temperaturas en un día invernal de una ciudad


han sufrido las siguientes variaciones:
Temperatura (ºC)

Hora
Histograma
Un histograma es una representación gráfica
de una variable en forma de barras.
Se utilizan para variables continuas o para
variables discretas, con un gran número de datos,
y que se han agrupado en clases.
En el eje abscisas se construyen unos
rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de
cada intervalo.
La superficie de cada barra es proporcional a la
frecuencia de los valores representados.
Ejemplo
El peso de 65 personas adultas viene dado
por la siguiente tabla:

En el histograma adjunto se graficaron dichos datos.


DIAGRAMA DE TALLO Y HOJA
DIAGRAMA DE TALLO Y HOJA

Un diagrama de tallo y hoja es un método usado para


organizar datos en Estadística. El valor mayor común
de los datos se utiliza como tallo y el siguiente valor
mayor de posición común se usa para formar las hojas.

Ejemplo Las edades de un grupo de amigos son las


siguientes: 11, 12, 10, 11, 11, 10, 12, 12, 11

Por medio del diagrama podemos observar que la edad


de los amigos se concentran en los 11 años
Medidas de tendencia central
Notación de Sumatoria
• El símbolo del lado
N

 i
indica la suma de todos
los Xi desde i=1 hasta
i=N. X
i 1
Notación de Sumatoria
• Es decir:
N

X
i 1
i  X 1  X 2  ...  X N
• Propiedades:
N

X Y
i 1
i i  X 1Y1  X 2Y2  ...  X nYn
N N

 aX
i 1
i  aX 1  aX 2  ...  aX n a  X i
i 1
Notación de Sumatoria
• Propiedades:
n n n n

  aX
i 1
i  bYi  cZ i   a  X i  b Yi  c  Z i
i 1 i 1 i 1
Medidas de tendencia central para
datos no agrupados: La Media
• La Media Aritmética: la media de un conjunto N de
números X1, X2,X3,…,XN se denota X (o “X barra”) y
se define por:
N

X 1  X 2  X 3  ...  X N X i
 X
X  i 1

N N N
Medidas de tendencia central para
datos no agrupados: La Media
• Ejemplo:
• Tenemos los siguientes números:
• 19, 80, 21, 74, 66
• La media se calcula:

19  80  21  74  66 260
x   52
5 5
• Calcular la media para los siguientes números:
• 70, 98, 54, 97, 26
Medidas de tendencia central para
datos no agrupados: La Media
• La Media Aritmética Ponderada: A veces se asocia a
los números X1, X2,…, XN ciertos factores de peso (o
pesos) w1, w2,…, wN, dependiendo de la influencia
asignada a cada número. En tal caso,

w1 X 1  w2 X 2  ...  wN X N w X i i
X  i 1
w1  w2  ...  wN N

w
i 1
i
• Ejemplo:
En el curso de estadística del Prof. Hidalgo la nota bimestral se calcula
como una media ponderada. Por cuanto que el promedio de laboratorios
representa el 30% de la nota semestral. El promedio de ejercicios
parciales representa el 30% y el examen semestral el restante 40%.

Se obtiene en este curso los siguientes promedios al final del semestre:


laboratorios 90 pts. Parciales 75% pts. Y en el examen semestral 70
pts.; el promedio semestral se calcula de la siguiente forma.:
• Ejemplo
• La nota final de una asignatura es una media ponderada
de las notas que han obtenido los alumnos en los cuatro
elementos evaluables que determina el profesor. El
responsable de la asignatura otorga un peso de 3 al
examen inicial, de 1 al trabajo entregable, 2 al trabajo
final y 4 al examen final. Las notas de un alumno han
sido las siguientes:
Medidas de tendencia central para
datos no agrupados: La Mediana
• La Mediana: la mediana de un conjunto de números
ordenados en magnitud es el valor central o la
media de los dos valores centrales.

• Cuando hay un número impar de observaciones, es


la observación (N+1)/2:

Mediana : X N 1
2
Medidas de tendencia central para
datos no agrupados: La Mediana
• Ejemplo:
• Si tenemos el siguiente conjunto de datos:
• 344, 190, 399, 473, 170, 363, 43, 671, 75, 421, 702,
846, 74, 652, 216, 304, 390, 457, 652, 700, 636, 934,
77, 444, 238, 78, 429,65, 927
• para obtener la mediana, primero debemos
ordenarlos:
• 43, 65, 74, 75, 77, 78, 170, 190, 216, 238, 304, 344,
363, 390, 399, 421, 429, 444, 457, 473, 636, 652,
652, 671, 700, 702, 846, 927, 934.
Medidas de tendencia central para
datos no agrupados: La Mediana
• una vez ordenados, se deben contar:
• 43, 65, 74, 75, 77, 78, 170, 190, 216, 238,
304, 344, 363, 390, 399, 421, 429, 444,
457, 473, 636, 652, 652, 671, 700, 702,
846, 927, 934.
• Son 29 observaciones.
• Entonces, la observación del medio es la
número 15 (ya que (29+1)/2=15).
• Y esa observación es 399.
Medidas de tendencia central para
datos no agrupados: La Mediana
• Obtener la mediana para los siguientes
datos:
• 0, 7, 15, 18, 24, 44, 45, 49, 50, 68, 70, 75,
86, 88, 93, 97, 99.
• el número de observaciones es 17, por lo
que el valor mediano va a ser el noveno,
es decir:
• Me=50.
Medidas de tendencia central para
datos no agrupados: La Mediana
• Cuando N es par se calcula el promedio entre los
dos valores del medio:

XN  XN
1
Mediana  2 2
2
Medidas de tendencia central para
datos no agrupados: La Mediana
• Ejemplo:
• 2, 4, 9, 16, 29, 45, 60, 65, 67, 68
• Aquí hay 10 observaciones, luego, se debe
obtener el promedio de las que están “en el
medio”.
• Es decir las obs. 5 y la 6.
29  45 74
Me    37
2 2
Medidas de tendencia central para
datos no agrupados: La Mediana
• Ejercicio: Obtener la mediana de:
• 3, 19, 33, 38, 40, 40, 45, 50, 55, 58, 74, 98
Medidas de tendencia central para
datos no agrupados: La Moda
• La Moda: la moda de un conjunto de
números es el valor que ocurre con
mayor frecuencia; es decir, el valor más
frecuente. La moda puede no existir e
incluso no ser única.
• La distribución con una sola moda se
llama unimodal y con dos es bimodal.
Medidas de tendencia central para
datos no agrupados: La Moda
• Ejemplo: determinar la moda de los
siguientes datos:
• 10, 19, 21, 21, 32, 47, 47, 47, 71, 71,
73, 84, 89, 98
• Dado que el valor que más se repite es
el 47,
• Moda = 47
Ejercicio, determinar la moda de los
siguientes datos:
•15, 23, 25, 30, 30, 41, 67, 78, 78, 79, 81, 84,
87, 89, 99.
Moda = ?

•11, 14, 21, 36, 38, 39, 41, 42, 43, 48, 51, 65,
72, 95
Moda = ?
Medidas de tendencia central para
datos agrupados: La Media
• Media aritmética para datos agrupados:
Cuando se cuenta con datos agrupados
en una distribución de frecuencia, todos
los valores que caen dentro de un
intervalo de clase dado se consideran
igual a la marca de clase, o punto
medio del intervalo.
Medidas de tendencia central para
datos agrupados: La Media
• Con Xj como marca de la clase j y fj como
frecuencia de la misma, se tiene que:
M

f
j 1
j Xj
X
N
• Nótese que se asume que hay M clases
Medidas de tendencia central para
datos agrupados: La Media
• Ejemplo:
• A partir de la LI LS Marca fi fr
siguiente tabla de 0 150 75 285 0.012
distribución de
150 300 225 5850 0.244
frecuencia, encuentre
la media. 300 450 375 4655 0.194
450 600 525 7382 0.308
600 750 675 856 0.036
750 900 825 4948 0.206
N 23976
Medidas de tendencia central para
datos agrupados: La Media
• Se puede hacer de dos maneras. Ambas
provienen de la definición de promedio
ponderado.
• La primera suma las frecuencias
multiplicadas por su marca y se divide por N.
• La segunda simplemente suma la
multiplicación de las marcas por las
frecuencias relativas.
Medidas de tendencia central para
datos agrupados: La Media

LI LS Marca fi fr M*fi
0 150 75 285 0.012 21375
150 300 225 5850 0.244 1316250
300 450 375 4655 0.194 1745625
450 600 525 7382 0.308 3875550
600 750 675 856 0.036 577800
750 900 825 4948 0.206 4082100

N 23976 11618700
Medidas de tendencia central para
datos agrupados: La Media
11618700
x  484.60
23976
Calcular la media para los datos distribuidos en la siguiente
tabla de frecuencia :
 

N Lm Ls f Mc
i
1 40,0 48,1 3 44,1
2 48,1 56,1 8 52,1
3 56,1 64,1 11 60,1
4 64,1 72,1 32 68,1
5 72,1 80,1 21 76,1
6 80,1 88,1 18 84,1
7 88,1 96,1 14 92,1
8 96,1 104,0 1 100,1
Medidas de tendencia central para
datos agrupados: La Media

LI LS Marca fi fr marca*fr
0 150 75 285 0.012 0.892
150 300 225 5850 0.244 54.899
300 450 375 4655 0.194 72.807
450 600 525 7382 0.308 161.643
600 750 675 856 0.036 24.099
750 900 825 4948 0.206 170.258

N 23976 484.60
Medidas de tendencia central para
datos agrupados: La Mediana
• La mediana se obtiene por interpolación y está
dada por:
N

2
   1 
f a  
Mediana  L1   A
 f mediana 
 
L1  Frontera inferior de la clase mediana (la que contiene a la mediana)
N  Número de datos (frecuencia total)
  fa  1
 Suma de las frecuencias de las clases inferiores a la mediana
f mediana  Frecuencia de la clase mediana
A  Ancho de la clase mediana
Medidas de tendencia central para
datos agrupados: La Mediana
• Es una interpolación debido a que en
esta fórmula está implícito el supuesto
de que los datos se distribuyen de
manera lineal en el intervalo.
Medidas de tendencia central para
datos agrupados: La Mediana
• Ejemplo

LI LS Marca fi fa
0 150 75 285 285
150 300 225 5850 6135
300 450 375 4655 10790
450 600 525 7382 18172
600 750 675 856 19028
750 900 825 4948 23976

N 23976
Medidas de tendencia central para
datos agrupados: La Mediana
• Lo primero que se debe hacer es determinar la
clase donde está la mediana.
• Lo anterior se realiza dividiendo N por 2, es
decir:
• 23976/2=11988
• A continuación se debe encontrar la clase
mediana, la cual es la que tiene la frecuencia
acumulada mayor a la observación mediana.
• En este caso:
Medidas de tendencia central para
datos agrupados: La Mediana
• Ejemplo

LI LS Marca fi fa
0 150 75 285 285
150 300 225 5850 6135
300 450 375 4655 10790
450 600 525 7382 18172
600 750 675 856 19028
750 900 825 4948 23976

N 23976
Medidas de tendencia central para
datos agrupados: La Mediana
• Luego se debe aplicar la fórmula: Frecuencia
acumulada
N
 23976  anterior a la
  10790  frec. mediana
Mediana  450   2 *150 
 7382 
 
Ancho del Intervalo

Frecuencia Mediana
Límite Inferior de
la frecuencia
mediana
Medidas de tendencia central para
datos agrupados:
 23976
La Mediana

  10790 
Mediana  450   2 *150 
 7382 
 
 11988  10790 
Mediana  450   *150 
 7382 
 1198 
Mediana  450   *150 
 7382 
Mediana  450   0.162 *150 
Mediana  450  24.323
Mediana  474.323
Medidas de tendencia central para
datos agrupados: La Moda
• La moda, para datos agrupados es simplemente la
marca de la clase con mayor frecuencia.

LI LS Marca fi En este caso,


0 150 75 285 la moda es:
Moda = 525
150 300 225 5850
300 450 375 4655
450 600 525 7382
600 750 675 856
750 900 825 4948
MEDIDAS DE DISPERSIÓN
Miden qué tanto se dispersan las observaciones
alrededor de su media.
MEDIDAS DE DISPERSIÓN
En algunos casos existen conjuntos de datos que tienen la misma
media y la misma mediana, pero esto no refleja qué tan dispersos
están los elementos de cada conjunto.

Ejemplo:

Conjunto 1. 80, 90, 100, 110, 120


Conjunto 2. 0, 50, 100, 150, 200

Conjunto 1 80  90  100  110  120


Media   100
5

Conjunto 2 0  50  100  150  200


Media   100
5

Observa que para ambos conjuntos la Mediana es igual


a 100. También nota que los datos del conjunto 2 están
más dispersos con respecto a su media que los datos
del conjunto 1.
MEDIDAS DE DISPERSIÓN

Existen diversas medidas estadísticas de dispersión, pero


muchos autores coinciden en que las principales son:

Rango

Varianza

Desviación estándar

Coeficiente de variación
RANGO
Mide la amplitud de los valores de la muestra y se
calcula por diferencia entre el valor más elevado (Límite
superior) y el valor más bajo (Límite inferior).
FÓRMULA

Rango  X MAX  X MIN


Ejemplo 1.

Ante la pregunta sobre número de hijos por familia, una muestra de


12 hogares, marcó las siguientes respuestas:

2 1 2 4 1 3
2 3 2 0 5 1

Calcula el rango de la variable Rango  5  0  5


Solución.
Ejemplo 2.

Hay dos conjuntos sobre la cantidad de lluvia (mm) en Taipei y


Seúl en un año.
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Taipei 86 135 178 170 231 290 231 305 244 122 66 71
Seúl 40 77 83 89 147 168 184 252 209 101 32 13

Calcula el rango en cada una de las ciudades.

Solución.

Aplicando la fórmula correspondiente tenemos:

Taipei
Rango  305mm  66mm  239mm En este caso se puede
observar que el rango
es el mismo para
Seúl Rango  252mm  13mm  239mm
ambos casos aunque
las cantidades sean
diferentes.
Cantidad de lluvia en Taipei y Seúl 1998

Cantidad de lluvia (mm)


350
300
250 Taipei
200
150 Seoul
100
50
0

Mes
VARIANZA (Datos no agrupados)
Mide la distancia existente entre los valores de la serie y la
media. Se calcula como sumatoria de las diferencias al
cuadrado entre cada valor y la media, multiplicadas por el
número de veces que se ha repetido cada valor. La sumatoria
obtenida se divide por el tamaño de la muestra. n

FÓRMULA  i
( x  x ) 2

Muestral s2  i 1

n 1

Poblacional
 i x
( x   ) 2

2  i 1

N
La varianza siempre será mayor que cero. Mientras más se aproxima a
cero, más concentrados están los valores de la serie alrededor de la
media. Por el contrario, mientras mayor sea la varianza, más dispersos
están.

Ejemplo 1.

Calcula la varianza para los siguientes datos

2 1 2 4 1 3 2 3 2 0 5 1

Solución.

Primero es necesario obtener la media. En este caso x  2.16

Ahora aplicamos la fórmula correspondiente


(2  2.16)2  (1  2.16)2  (2  2.16)2  (4  2.16)2  (1  2.16)2  (3  2.16)2  (2  2.16)2  (3  2.16)2  (2  2.16)2  (0  2.16)2  (5  2.16)2  (1  2.16)2
s
2

12  1

21.6672
s2   1.9697
11
Ejemplo 2.

A continuación se muestran dos conjuntos de datos obtenidos a partir de un


experimento químico que realizaron dos estudiantes distintos. Calcular la
varianza.
Volumen de ácido medido (cm^3)
Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11

Solución.

Primero es necesario obtener la media de cada conjunto de datos. En este caso

Estudiante A 8  12  7  9  3  10  12  11  12  14
x  9.8
10

Estudiante B 7  6  7  15  12  11  9  9  13  11
x  10
10

Ahora aplicamos la fórmula correspondiente


Solución (Continuación).

Estudiante A
(8  9.8)2  (12  9.8) 2  (7  9.8) 2  (9  9.8) 2  (3  9.8) 2  (10  9.8) 2  (12  9.8) 2  (11  9.8) 2  (12  9.8) 2  (14  9.8) 2
s 
2

10  1

91.6
s2   9.16
10

Estudiante B

(7  10)2  (6  10)2  (7  10)2  (15  10)2  (12  10)2  (11  10) 2  (9  10) 2  (9  10)2  (13  10)2  (11  10)2
s 
2

10  1

76
s2   7.6
10
DESVIACIÓN ESTÁNDAR (Datos no agrupados)
También llamada desviación típica, es una medida de dispersión usada en
estadística que nos dice cuánto tienden a alejarse los valores puntuales del
promedio en una distribución.

Específicamente, la desviación estándar es "el promedio de la distancia de cada


punto respecto del promedio". Se suele representar por una S o con la letra
sigma,σ, según se calcule en una muestra o en la población.

Una desviación estándar grande indica que los puntos están lejos de la media, y
una desviación pequeña indica que los datos están agrupados cerca de la
media.
n
FÓRMULA  i
( x  x ) 2

s i 1
Muestral n 1

N
Poblacional
 (x i   x )2
  i 1

N
Ejemplo 1.

Si retomamos el ejemplo 1 que corresponde a la varianza:

Calcula la desviación estándar para los siguientes datos

2 1 2 4 1 3 2 3 2 0 5 1

Solución.

Una vez que hemos calculado la media y la varianza, sólo resta calcular la raíz cuadrada de
la varianza.

x  2.16
21.6672
s2   1.9697
11
Ejemplo 2.

Considerando nuevamente el segundo ejemplo que estudiaste para calcular la varianza,


tenemos:

A continuación se muestran dos conjuntos de datos obtenidos a partir de un experimento


químico que realizaron dos estudiantes distintos. Calcular la varianza.

Volumen de ácido medido (cm^3)


Estudiante A 8 12 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11

Solución.

Una vez que has calculado la media y la varianza, es necesario calcular la desviación
estándar a partir de la obtención de la raíz cuadrada de la varianza.

Estudiante A 91.6
s2   9.16
10

Estudiante B 76
s2   7.6
10
COEFICIENTE DE VARIACIÓN
Es una medida de dispersión que se utiliza para poder
comparar las desviaciones estándar de poblaciones con
diferentes medias y se calcula como cociente entre la
desviación típica y la media.
FÓRMULA
S
CV   100%
Muestral x

Poblacional

CV   100%

Ejemplo 1.
En dos cursos los promedios que sacaron sus alumnos
fueron 6.1 y 4.3 y las desviaciones estándar respectivas
fueron 0.6 y 0.45 respectivamente. ¿En qué curso hay mayor
dispersión?

Solución
Para responder esto, debemos obtener el coeficiente de
variación aplicando la fórmula S
CV   100%
x
0.6
CVA  (100%)  9.8%
6.1
0.45
CVB  (100%)  10.4%
4.3
Claramente, el curso A tiene una dispersión menor que el B,
pese a presentar una mayor desviación estándar.
VARIANZA Y DESVIACIÓN ESTÁNDAR (Datos agrupados)

Cuando los datos están agrupados en tablas de frecuencias, el significado de


las medidas de dispersión es el mismo, sin embargo la manera de calcularlas es
diferente.

Enseguida se muestra la fórmula para la varianza, pero recuerda que la


desviación estándar es igual a la raíz cuadrada de la primera.

FÓRMULA
k

 f i ( xi  x ) 2
Muestral s 
2 i 1

n 1
k k

Poblacional
 fi ( xi   ) 2
 fi xi2
 2  i 1  i 1  2
N N
DESVIACIÓN MEDIA
La desviación media es la media aritmética de
los valores absolutos de las desviaciones
respecto a la media

La desviación media se representa por Dx


• CUANTILES
• Los cuantiles son medidas de posición que se determinan mediante un método que determina
la ubicación de los valores que dividen un conjunto de observaciones en partes iguales.
• Los cuantiles son los valores de la distribución que la dividen en partes iguales, es
decir, en intervalos que comprenden el mismo número de valores. Cuando la
distribución contiene un número alto de intervalos o de marcas y se requiere obtener un
promedio de una parte de ella, se puede dividir la distribución en cuatro, en diez o en
cien partes.
• Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes; los
deciles, cuando dividen la distribución en diez partes y los centiles o percentiles,
cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los
percentiles, son en cierta forma una extensión de la mediana.
• CUARTILES
• Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
• Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es
el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer
cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

• Datos Agrupados
• Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos
casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de
datos agrupados es la siguiente:
• k= 1,2,3
• Donde:
• Lk = Límite real inferior de la clase del cuartil k
• n = Número de datos
• Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
• fk = Frecuencia de la clase del cuartil k
• c = Longitud del intervalo de la clase del cuartil k
HALLAR : CUARTIL 1, 2 Y 3
• DECILES
• Los deciles son ciertos números que dividen la sucesión de datos ordenados
en diez partes porcentualmente iguales. Son los nueve valores que dividen al
conjunto de datos ordenados en diez partes iguales, son también un caso
particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se
leen primer decil, segundo decil, etc.
• Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
• Datos Agrupados
• Para datos agrupados los deciles se calculan mediante la fórmula.
• k= 1,2,3,... 9
• Donde:
• Lk = Límite real inferior de la clase del decil k
• n = Número de datos
• Fk = Frecuencia acumulada de la clase que antecede a la
clase del decil k.
• fk = Frecuencia de la clase del decil k
• c = Longitud del intervalo de la clase del decil k

Medidas de forma: Grado de concentración
• Las medidas de forma permiten conocer que forma
tiene la curva que representa la serie de datos de la
muestra. En concreto, podemos estudiar las
siguientes características de la curva:

[Link]ía
[Link]
[Link]ón
Medidas de forma:
• a) Asimetría: mide si la curva tiene una forma simétrica,
es decir, si respecto al centro de la misma (centro de
simetría) los segmentos de curva que quedan a derecha
e izquierda son similares.

• b) Curtosis: mide si los valores de la distribución están


más o menos concentrados alrededor de los valores
medios de la muestra.

• c) Concentración: mide si los valores de la variable


están más o menos uniformemente repartidos a lo largo
de la muestra.
• a) Asimetría
• Hemos comentado que el concepto de asimetría
se refiere a si la curva que forman los valores de
la serie presenta la misma forma a izquierda y
derecha de un valor central (media aritmética)
• Coeficiente de Asimetría de Fisher

• Sí la distribución es simétrica en el denominador tendremos el mismo


número de desviaciones positivas como negativas y por tanto g 1 = 0.

• Si g1>0 la distribución es asimétrica positiva o asimétrica a derecha.

• Si g1<0 la distribución es asimétrica negativa o asimétrica a izquierda.


• Coeficiente de Karl Pearson

Donde:
• = media aritmética.
• Md = Mediana.
• s = desviación típica o estándar.
• Nota:
• El Coeficiente de Pearson varía entre -3 y 3
• Si As < 0 ? la distribución será asimétrica negativa.
• Si As = 0 ? la distribución será simétrica.
• Si As > 0 ? la distribución será asimétrica positiva.
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, y la Medida de Fisher
dada la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17

Solución:
Solución:
• b) Curtosis

• El Coeficiente de Curtosis analiza el


grado de concentración que presentan
los valores alrededor de la zona central
de la distribución.
• b) Curtosis
• Se definen 3 tipos de distribuciones
según su grado de curtosis:
• c) Curtosis
• Distribución mesocúrtica: presenta un grado
de concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una
distribución normal).
• c) Curtosis
• Distribución leptocúrtica: presenta un
elevado grado de concentración alrededor
de los valores centrales de la variable.
• c) Curtosis
• Distribución platicúrtica: presenta un reducido
grado de concentración alrededor de los valores
centrales de la variable.
• b) Curtosis
• El Coeficiente de Curtosis viene
definido por la siguiente fórmula:
• b) Curtosis
• Los resultados pueden ser los siguientes:

• g2 = 0 (distribución mesocúrtica).

• g2 > 0 (distribución leptocúrtica).

• g2 < 0 (distribución platicúrtica).


• c) Concentración
Las medidas de concentración tratan de poner de manifiesto el
mayor o menor grado de igualdad en el reparto total de los
valores de la variable. Son por tanto, indicadores del grado
de equidistribución de la variable. Estas medidas tienen
especial aplicación a variables económicas (rentas, salarios,
etc.).
Supongamos que tengamos n sujetos cuyos valores de la
variable (rentas, salarios, etc.) son: 
• x1 x2 x3 <...<xn

nos interesa estudiar hasta que punto la suma total de valores


(rentas, salarios, etc.) esta equitativamente repartida.
• c) Concentración
• Las dos situaciones extremas serian:
[Link]ón máxima: de los n sujetos, sólo uno percibe el total y los
demás nada:

• x1 =x2 =x3 =...=xn-1=0 y xn0


 
[Link]ón mínima o equidistribución: todos tienen el mismo valor 
• x1 =x2 =x3 =...=xn-1 =xn
  NOTA: Hay que tener en cuenta que desde el punto de vista estadístico
los términos dispersión y concentración no son opuestos, recordemos
que el primero hacía referencia a la variabilidad de los datos con
respecto al promedio, mientras que el segundo, como acabamos de
definir, a la no equidad en el reparto de la suma total de la variable.
• c) Concentración
• Para medir el nivel de concentración de una
distribución de frecuencia se pueden utilizar
distintos indicadores, entre ellos el Índice de Gini.
• Este índice se calcula aplicando la siguiente
fórmula:
• a) Concentración
• En donde pi mide el porcentaje de
individuos de la muestra que presentan un
valor igual o inferior al de xi.
• Mientras que qi se calcula aplicando la
siguiente fórmula:
• a) Concentración
• El Indice Gini (IG) puede tomar valores entre 0
y 1:
• IG = 0 : concentración mínima. La muestra está
unifomemente repartida a lo largo de todo su
rango.
• IG = 1 : concentración máxima. Un sólo valor
de la muestra acumula el 100% de los
resultados.
• a) Concentración
• Ejemplo: vamos a calcular el Indice
Gini de una serie de datos con los
sueldos de los empleados de una
empresa (millones pesos).

• ejemplo Indice Gini [Link]


1.- Complete la Tabla de Distribución de Frecuencias
2.- Grafique el Histograma y Polígono de frecuencias
3.- Hallar la media aritmética, Mediana y moda.
4.- Hallar la Varianza, Desviación Estándar, Rango y CV.
5.- Hallar los Cuartiles: 1 – 2 y 3
6.- Hallar los Decíles: 3, 5, 9
7.- Hallar los percentiles: 25, 40, 50, 90 y 95.
Departamento de Estadística

INTRODUCCIÓN A LA PROBABILIDAD

Prof. Ing. David Hidalgo


D.
I. CONCEPTOS BÁSICOS

El estudio de fenómenos de diversa naturaleza permite clasificar


éstos en dos grandes grupos:

a) Fenómenos determinísticos: aquellos en los cuales una


misma acción produce siempre el mismo efecto.
Ejemplo:Después de las 6:00 son las 7:[Link]és del día sigue la
noche. Ir a la escuela todos los días. Alimentarse al mediodía.

b) Fenómenos probabilísticos o aleatorios: aquellos en los


cuales no siempre puede predecirse con certeza el resultado
de una misma acción.
Taller individual
1- En el siguiente listado, marca con una X la expresión que se refiere a un
suceso determinista.
a. Ir a la escuela de lunes a viernes………….
b. Ganar el premio de la lotería………………..
c. Bañarse todos los días…………………………..
d. La semana tiene 7 días………………………….
e. Ganar la tómbola del carro……………………
f. Después de miércoles sigue jueves……..
g. Diciembre tiene 31 días………………………….
h. Alimentarse en el día………………………..
i. Ganar la competencia de natación…………
j. El año tiene 12 meses………………………………
2- En el siguiente listado coloca una X a la expresión que se refiere a un
suceso de azar.

[Link] niñas escogerán una flor; la que tenga el papelito que dice “reina”,
ganará…………………………………….............................................

b. Mi papá está jugando dominó con sus amigos……………………..

c. Cada niño (a) sacará un papelito de una bolsita y contestará la pregunta


que le toque…………………………………………………………………..

d. El equipo de fútbol jugará el domingo………………………………….

e. Deposité un cupón para participar en la tómbola del carro.

f. Mi abuela juega billar con los vecinos…………………………………..

g. Mi tía compró un billete para el sorteo del miércoles………


¿QUÉ ES INCERTIDUMBRE?

La falta de conocimiento cierto de las cosas es la mayor fuente de


ansiedad para el hombre y es natural su deseo de remediarla. La
carencia de certeza o de conocimiento cierto de la ocurrencia de
determinados eventos, lleva a correr ciertos riesgos en las
decisiones esto es incertidumbre y es ahí donde el uso de las
probabilidades es de gran ayuda para minimizarlos.

“Es una verdad cierta que, cuando no está en nuestra mano


distinguir las opiniones verdaderas, debemos seguir las más
probables”. (Descartes)
1.- Experimento Aleatorio (E)
• fenómeno empírico que repetido bajo las mismas condiciones, no
Es un
siempre arroja el mismo resultado.

Características

a) Es repetible: se puede realizar u observar en forma indefinida


(n veces) en las mismas condiciones.
b) Se conocen a priori los resultados posibles: se puede conocer o
delimitar el conjunto de todos los resultados posibles, aun cuando no
se puede predecir el resultado particular en una realización del
experimento.
c) Presenta regularidad estadística: si el experimento se repite pocas
veces los resultados parecen mostrar un comportamiento caótico,
mientras que al repetirlo un gran número de veces se puede detectar
cierta regularidad en el comportamiento de los resultados.
Ejemplos
a) Analizar 5 solicitudes de crédito y registrar el número de
las que resultaron aprobadas.
b) Analizar solicitudes de crédito hasta que por primera vez
se obtenga una solicitud aprobada.
c) Observar durante 1 h una caja de cierta agencia bancaria y
registrar el número de personas que realizan por lo menos
una operación.
c) Hacer un pedido para reponer inventario y registrar el
tiempo (en días) que tardamos en recibirlo.

El desarrollo de cada uno de estos ejemplos se le denomina


experimento aleatorio.
2.- Espacio Muestral (S)
• el conjunto no vacío formado por todos los resultados
Es
posibles y razonables de un experimento aleatorio.

Clasificación
a) Finito: cuando el espacio muestral es un conjunto de
eventos numerable.
b) Infinito: cuando el espacio muestral es un conjunto
eventos no numerable.
Ejemplos
EXPERIMENTO ALEATORIO ESPACIO MUESTRAL
a) Analizar 5 solicitudes de crédito y
registrar el número de las que S= {0,1,2,3,4,5}
resultaron aprobadas.
b) Analizar solicitudes de crédito hasta S= {a, ra, rra,rrra,…,rrrrrrrrrra}
que por primera vez se obtenga una
solicitud aprobada. a: aprobada, r: rechazada

c) Observar durante 1 h una caja de cierta


agencia bancaria y registrar el número S= {0,1,2,3,4,5,…,n}
de personas que realizan por lo menos n: total de personas
una operación.
d) Hacer un pedido para reponer
inventario y registrar el tiempo (en S={t: t N}
días) que tardamos en recibirlo.
3.- Suceso o Evento
Es cualquier subconjunto de resultados posibles y razonables de
un experimento aleatorio.

Si en una realización del experimento aleatorio se satisfacen las


condiciones que definen un suceso, se dice que ha ocurrido
dicho suceso.

Tipos
a) Simples: son sucesos indivisibles; es decir, aquellos que están
compuestos por un solo punto muestral. Ejemplo: en el
experimento aleatorio lanzar un dado, cualquiera de los lados
del dado es un suceso simple.
b) Compuestos: son sucesos formados por dos o más
sucesos simples. Es cualquier subconjunto no unitario del
espacio muesral. Ejemplo: en el experimento aleatorio
lanzar un dado, el suceso “que salga un número par” es
compuesto.

c) Mutuamente excluyentes: son sucesos disjuntos; esto es su


intersección es el conjunto vacío. Ejemplo: en el
experimento aleatorio aplicar un examen a un estudiante,
los sucesos “obtener una nota sobresaliente” y “aplazar la
prueba” son mutuamente excluyentes (mex). No se presenta
la simultaneidad.
d) Colectivamente Exhaustivos: dos sucesos A y B son
colectivamente exhaustivos si la unión de ellos es el espacio
muestral.

e) Seguros: Son aquellos que coinciden con el espacio muestral


asociado a un experimento aleatorio.

f) Imposible (): es aquel que no ocurre nunca; esto es, el


conjunto vacío. Por ejemplo, si al lanzar un dado común se
puede obtener un 7.

f) Contrario (A): es aquel que ocurre cuando no ocurre el suceso


A. Por ejemplo,
Si P (lluvia)= 0,40, entonces P (no lluvia)= 1-P (lluvia)= 0,60
Ejemplos
SITUACIÓN PARTICULAR RESULTADOS POSIBLES
a) El número de solicitudes de
A= {4,5}
crédito aprobadas es superior a 3.
b) Analizar máximo 4 solicitudes de B={a,ra,rra,rrra}
crédito hasta que por primera vez
a: aprobada, r: rechazada
una solicitud sea aprobada.
c) Registrar entre 3 y 7 personas que
realizan por lo menos una C = {3,4,5,6,7}
operación.

d) El tiempo que tardamos en recibir


D ={ t:0<t<3 }
el pedido es inferior a 3 días.

A cada conjunto de resultados posibles, asociado a las


situaciones particulares, se le denomina suceso
II. CONCEPTO DE PROBABILIDAD

Los experimentos aleatorios producen resultados inciertos y


la probabilidad es una medida de la incertidumbre. Sin
embargo, la incertidumbre es de naturaleza muy diferente
según lo sea el experimento. No existe un acuerdo total entre
los estudiosos de la probabilidad al respecto, por lo que se
pueden identificar tres grandes enfoques del pensamiento
probabilístico. A continuación, se exponen los principios
generales de cada una de éstos, sin tomar partido a favor de
alguno en particular.
1.- Enfoque Clásico o a priori
Está basado en el concepto de equiprobabilidad del espacio
muestral y fue introducido por Laplace. El cálculo de la
probabilidad bajo la concepción clásica, se realiza mediante la
siguiente regla.

Regla de Laplace:
La probabilidad de un suceso A es igual al cociente del número
de casos favorables al suceso, sobre el número total de casos
posibles.
Ejemplos

a) En el lanzamiento de una moneda perfecta la probabilidad de


cara debe ser igual que la de sello y, por tanto, ambas iguales
a 1/2.

b) La probabilidad de cada uno de los seis sucesos elementales


asociados al lanzamiento de un dado común (no cargado)
debe ser 1/6.
2.- Enfoque Frecuentista o a posteriori
Esta Ley propuesta por Bernoulli, plantea que la frecuencia
relativa de un suceso tiende a estabilizarse en torno a un
número, a medida que el número de pruebas del experimento
crece indefinidamente. Así bajo la concepción frecuentista, si
se repite un experimento indefinidamente, la probabilidad de
un suceso A es un número ideal al que se aproxima su
frecuencia relativa cuando el total de repeticiones tiende a
infinito.
N 
P ( A )  lim  A 
N 
 N 
Siendo NA la frecuencia absoluta del suceso A.
Ejemplo
Se elaboró la siguiente tabla con los 5946 empleados de cierta
institución financiera, según su nivel de ingreso:
NÚMERO DE
NIVEL DE INGRESO ($.) PORCENTAJE
EMPLEADOS
Menos de 500 2136 36,0
500-999 1548 26,0
1.000-1.499 1202 20,2
1.500-1.999 648 10,9
2.000 o más 412 6,9
Total 5946 100,0
¿Cuál es la probabilidad de que el ingreso de un empleado sea
menor de $. 500?

Solución: 36,0%

¿Cuál es la probabilidad de que el ingreso de un empleado sea


$1.500 o más?

Solución: 17,8%
3.- Enfoque Subjetivo
La Probabilidad de ocurrencia de un suceso es cuantificada por
una persona (o un grupo de personas) catalogada (s) como
experta (s) utilizando la información que posee (n).

Ejemplo
Un ingeniero de transporte a cargo de un nuevo sistema de
circulación, expresa que la probabilidad que el sistema
funcionará correctamente el 80,0% de las veces.
Con base en esta convicción, ¿cuál es la probabilidad de que el
sistema funcione apropiadamente?
Solución: 80,0%
Definición Axiomática de Kolmogorov
Dado un experimento aleatorio cualquiera (E) que tiene
asociado un espacio muestral (S), se llama probabilidad P
(A) que asigna a cada suceso o evento (A) un número real. Tal
que satisfaga con las siguientes propiedades o axiomas:
Axioma 1: 0  P ( A )  1
Axioma 2: P(S)=1
Axioma 3: Si dos sucesos A y B son mutuamente excluyentes
(mex) entonces P (AUB)=P(A) +P(B)
Axioma 4: Si A1, A2,…,A4 son sucesos o eventos mex dos a
dos entonces, n n
P (U A i )  P ( A1 )  P ( A 2 )  ...  P ( A 4 )   P ( A i )
i 1 i 1
,
conocida como regla aditiva para sucesos o eventos mex.
Teoremas Fundamentales
Teorema 1
Si A es el conjunto vacio entonces su probabilidad es cero.
Es decir, P (  )  0

Teorema 2
Si A es un evento y A su complemento, entonces,
P(A)  1 P(A)

Teorema 3
Sean A y B dos sucesos mutuamente No Excluyentes de un
espacio muestral (S), entonces,
P (A  B )  P (A )  P (B )  P (A  B )
Teoremas Fundamentales
Teorema 4
Si A  B P (A)  P (B )

Por ser todo conjunto subconjunto de si mismo.

Leyes
a.- Ley de Probabilidad Condicional
Sea S un espacio muestral asociado a un experimento aleatorio.
Sean Ay B dos sucesos cualesquiera de S, tales que P(B) = 0. Se
define la probabilidad condicional de A dado B, P(A/B), como:
P(A  B)
P(A / B) 
P(B)
Leyes
b.- Ley Multiplicativa para Sucesos o Eventos Independientes.
Sea S un espacio muestral asociado a un experimento aleatorio.
Sean A y B sucesos de S. Se dice que A y B son sucesos
independientes si y sólo si:

P(A /B)  P(A) o P ( A  B )  P ( A ).P ( B )


Ejemplo:

Si P (A/B)= 0,20 y P (A)= 0,20, entonces A y B son sucesos


independientes.
c.- Ley Multiplicativa para Sucesos o Eventos Dependientes.
Partiendo de la definición de probabilidad condicional, podemos
obtener la probabilidad de la intersección mediante la siguiente
regla:
P ( A  B )  P ( A ).P ( B / A )
Considerando que P (B/A) = P (B)

En el caso de la intersección de tres sucesos,


P ( A  B  C )  P ( A ).P ( B / A ).P (C / A  B )
¿Qué es probabilidad?
Es una medida numérica de la posibilidad de
que ocurrirá un evento en la que sus valores
se asignan en una escala de 0 a 1.
PROBABILIDAD

Ejemplo.-
En cierta ciudad, las mujeres representan el 50%
de la población y los hombres el otro 50%. Se
sabe que el 20% de las mujeres y el 5% de
hombres están sin trabajo. Un economista
estudia la situación de empleo, elige al azar una
persona desempleada. Si la población total es
de 8000 personas,
¿ Cuál es la probabilidad de que la persona
escogida sea ?:
PROBABILIDAD
a).- Mujer
b).- Hombre
c).- Mujer dado que está empleado
d).- Desempleado dado que es hombre
e).- Empleado dado que es mujer

Sean los eventos:


M: Que sea Mujer
H: Que sea Hombre
D: Que sea Desempleado
E: Que sea Empleado
Tabla Número de elementos de los Eventos M, H, D, E y S

Desempleados Empleados Total


D E

Mujeres 800 3200 4000


M

Hombres 200 3800 4000


H

Total 1000 7000 8000


Tabla de Probabilidades

D E Total
M 800/8000 = .1 3200/8000= .4 4000/8000= .5

H 200/8000= .025 3800/8000= .475 4000/8000= .5

Total 1000/8000= .125 7000/8000= .875 8000/8000= 1


PROBABILIDAD

P(M) = .50
P(H) = .50
P(E) = .875
P(D) = .125
P(M/E) = P(ME)/P(E) = .40/.875 = .4571
P(D/H) = P(DH)/P(H) = .025/.5 = .05
P(E/M) = P(ME)/P(M) = .40/.5 = .8
P(M/D) = P(MD)/P(D) = .10/.125 = .8
P(H/D) = P(HD)/P(D) = .025/.125 = .2
PROBABILIDAD

Eventos dependientes e independientes


En el ejemplo anterior se tiene que
P(M) = .50
P(H) = .50
P(E) = .875
P(D) = .125
P(ME) = .40 P(M) P(E) = .4375
P(DH) = .025 P(D) P(H) = .0625
P(MD) = .10 P(M) P(D) = .0625
P(EH) = .475 P(E) P(H) = .4375
PROBABILIDAD

Por tanto los eventos M y E ,


D y H,
M y D,
EyH
son dependientes.
REGRESION LINEAL
SIMPLE
Una de las aplicaciones mas
importantes de la estadística implica la
estimación del valor medio de una
variable de respuesta y o la predicción
de algún valor futuro de y con base el
conocimiento de un conjunto de
variables independientes relacionadas,
x1 , x 2 , . . . x k .
Los modelos que se emplean para
relacionar una variable dependiente y
con las variables independientes x1, x2, . .
. xk se denominan modelos de regresión
o modelos estadísticos lineales porque
expresan el valor medio de y para
valores dados de x1, x2, . . . xk como una
función lineal de un conjunto de
parámetros desconocidos.
Los conceptos de análisis de regresión
se presentan empleando un modelo de
regresión muy sencillo, uno que
relaciona y con una sola variable x.
Aprenderemos a ajustar este modelo a
un conjunto de datos mediante el
método de los mínimos cuadrados.
Examinaremos los diferentes tipos de
inferencias que pueden hacerse a partir
de un análisis de regresión.
Un modelo de regresión simple:
supuestos

Supongamos que se quiere determinar


la magnitud de la compresión que se
producirá en un tipo de material de 2
pulgadas de espesor cuando se someta
a diferentes cantidades de presión.
Un modelo de regresión simple:
supuestos
Se prueban cinco trozos experimentales
del material bajo diferentes presiones.
Los valores de x (en unidades de 10
libras por pulgada cuadrada) y las
magnitudes de compresión y
resultantes (en unidades de 0.1 de
pulgada) se presentan en la tabla 1.
ESPÉCIMEN PRESIÓN COMPRESIÓN
  X Y
1 1 1
2 2 1
3 3 2
4 4 2
5 5 4

TABLA # 1
En la figura 1 se muestra una gráfica
de los datos, llamada diagrama de
dispersión. y
4

Figura 1. 2

0 1 2 3 4 X
y

0 1 2 3 4 X
y
4

0 1 2 3 4 X
y
4

3
Supongamos que
creemos que el
2
valor de y tiende a
1
aumentar de forma
0 1 2 3 4 5 X lineal conforme x
aumenta
Entonces, podríamos escoger un modelo
que relacione a y con x trazando una
línea recta a través de los puntos de la
figura.
y
4

0 1 2 3 4 5 X

Semejante modelo determinístico (uno


que no contempla errores de predicción)
podría ser adecuado si todos los puntos
de la figura quedaran sobre la línea
ajustada.
La solución es construir un modelo
probabilístico que relacione y con x; uno
que contemple la variación aleatoria de
los puntos de datos a los lados de una
línea recta.
Un tipo de modelo probabilístico, el
modelo de regresión lineal simple,
supone que el valor medio de y para un
valor dado de x se grafica como una
línea recta y que los puntos se desvían
de esta línea de medias en una cantidad
aleatoria (positiva o negativa) igual a ,
es decir:
y   0   1x  
y   0   1x  
y   0   1x  
y   0   1x  
y   0   1x  
Valor medio de y Error
para una x dada aleatorio

Donde 0 y 1 son parámetros


desconocidos de la porción
determinística del modelo.
y   0   1x  
Valor medio de y Error
para una x dada aleatorio
Si suponemos que los puntos se desvían
por encima y por debajo de la líneas de
medias, siendo algunas desviaciones
positivas, otras negativas, y con E() = 0,
entonces el valor medio de y es:
E ( y )  E (  0   1 x   )  ˆ 0  ˆ 1 x  E (  )  ˆ 0  ˆ 1 x
E ( y )  E (  0   1 x   )  ˆ 0  ˆ 1 x  E (  )  ˆ 0  ˆ 1 x
E ( y )  E (  0   1 x   )  ˆ 0  ˆ 1 x  E (  )  ˆ 0  ˆ 1 x

Por lo tanto, el valor medio de y para un


valor dado de x, representado por el
símbolo E(y), se grafica como una línea
recta con ordenada al origen igual a 00y ̂
pendiente igual a 1
y
4
E ( y )  ˆ 0  ˆ 1 x
3

2
ˆ 1  p e n d i e n t e
1

ˆ 0  o r d e n a d a a l o r i g e n
0
1 2 3 4 X
Modelo de regresión lineal simple
(probabilístico)
y   0   1x  
Donde: y = variable dependiente
x = variable independiente
E ( y )  0ˆ +
E(y)= 0 
 x
1 1
ˆ x es el componente
determinístico (la ecuación de una línea
recta)  = componente de error aleatorio
̂
00 = punto en que la línea corta el eje y
1 = pendiente de la línea
Si queremos ajustar un modelo de
regresión lineal simple a un conjunto
de datos, debemos encontrar
estimadores para los parámetros
̂
desconocidos, 00 y 1.
Los supuestos, que se resumirán a
continuación, son básicos para todo
análisis de regresión estadístico.
SUPUESTO 1:
La media de la distribución de
probabilidad de  es cero. Es decir, la
media de los errores a lo largo de una
serie infinitamente larga de
experimentos es cero para cada valor de
la variable independiente x. Este
supuesto implica que el valor medio de
y, E(y), para un valor dado de x es
( y )   ˆ 00 + 1ˆ x
EE(y)= 1x
SUPUESTO 2:
La varianza de la distribución de
probabilidad de  es constante para
todos los valores de la variable
independiente x
SUPUESTO 3:
La distribución de probabilidad de  es
normal
SUPUESTO 4:

Los errores asociados a cualquier dos


observaciones distintas son
independientes. Es decir, el error
asociado a un valor de y en particular no
tiene efecto alguno sobre los errores
asociados a otros valores de y
ESTIMACIÓN DE 0 ̂
0 y 1:
EL METODO DE LOS MÍNIMOS
CUADRADOS

La suma de los cuadrados de las


desviaciones se denomina suma de los
cuadrados del error y se denota con el
símbolo SSE. La línea recibe el nombre
de línea de mínimos cuadrados, línea de
regresión o ecuación de mínimos
cuadrados.
y

0
1 2 3 4 X
y
4

0
1 2 3 4 X
y
4

0
1 2 3 4 X

El modelo de línea recta para la respuesta


y en términos de x es: y= 0+1x + 
( y )  ˆ 00+  ˆ1x1 x
La línea de medias es: EE(y)=
y la línea ajustada, que esperamos
encontrar, se representa como:
yˆ   ˆ 0   ˆ 1 x
Formulas para las estimaciones de mínimos
cuadrados
SS xy
Pendiente: ˆ1 
SS xx
Ordenada al origen: ˆ 0  y  ˆ 1 x
n
Donde: S S x y  
i 1
( x i  x )( y i  y )

n
S S xx   (x
i 1
i  x) 2
Ejercicio:
A continuación tenemos las estaturas en
centímetros (muestra x) y el peso en
kilogramos (y) de niños de 6 años.

Niño 1 2 3 4 5 6 7 8 9 10
Estatura
121 123 108 118 111 109 114 103 110 115
(cm) x
Peso
25 22 19 24 19 18 20 15 20 21
(kg) y
Ejercicio:
Calcular: las medidas centrales, el
primero y segundo cuartil, los percentiles
30 y 70, el diagrama de dispersión
Ejercicio:
Con esta información encontrar la
ecuación de la línea recta E(y)=?

Niño 1 2 3 4 5 6 7 8 9 10
Estatura
121 123 108 118 111 109 114 103 110 115
(cm) x
Peso
25 22 19 24 19 18 20 15 20 21
(kg) y
CORRELACIÓN Y
REGRESIÓN LINEAL
CORRELACIÓN LINEAL
• RELACION TIPO ESTADISTICO ENTRE DOS
VARIABLES.
• EJEMPLOS
Horas de estudio (x) Calificación obtenida (y)
Libros leídos (x) Errores ortográficos (y)
Medidas preventivas (x) Núm. Lesiones (y)
Edad (x) Respuestas inadecuadas(y)
Contaminación(x) Enfermedades(y)
Características
La correlación se encuentra entre (-1, 1)
La correlación puede ser positiva.
La correlación puede ser negativa.
La correlación puede ser nula.
CORRELACIÓN POSITIVA
Significa que individuos que
tienen puntuaciones ALTAS en
una variable tienden a obtener
puntuaciones ALTAS en la otra
variable y viceversa.
Ejemplos

Gastos Ventas Edad Edad


millones $ millones $ novio (x) novia (y)
25 18
(x) (y)
27 29
2 50 31 25
3 60
34 27
5 120
6 150 36 27
10 180
40 30

45 36
CORRELACIÓN NEGATIVA
Significa que individuos que
tienen puntuaciones ALTAS en
una variable tienden a obtener
puntuaciones BAJAS en la otra
variable y viceversa.
Ejemplos
Edad Respuestas
Enfermedades
(x)
inadecuadas Vacunas
(y) (x) (y)
2 11 10 0
3 12 9 1
4 10
5 11 9 0

5 9 8 4
7 3
7 3
9 8
10 3 6 3
11 6
5 5
11 5
CORRELACIÓN NULA
Significa que no
existe dependencia
entre las variables.
Ejemplos
Edad Ventas (y) Utilidades
Calif.(x)
(x) (y)
10 0
2 11
3 12 9 1
4 10
9 0
5 11
5 9 8 4
7 3 7 3
9 8
10 3 6 3

11 6 5 5
11 5
DIAGRAMA DE 4,5
DISPERSIÓN
4
Representació 3,5
n en un 3
sistema de

Utilidades
2,5
coordenadas 2
rectangulares, 1,5
donde (x, y)
1
son los valores
0,5
de las variables
0
correlacionada 0 1 2 3
s años
Correlación positiva
120
G 100
A
80
N
A 60
N 40
C
I 20
A 0
S 0 20 40 60 80 100

VENTAS
CORRELACIÓN NEGATIVA
E
M
B
A
R
A
Z
O
S

ANTICONCEPTIVOS (x)
CORRELACIÓN NULA
3,5
Pa 3
rtid 2,5
os
2
ga 1,5
na 1
do 0,5
s 0
0 0,5 1 1,5 2 2,5 3

Calificaciones
COEFICIENTE DE CORRELACIÓN
DE PEARSON
• Sirve para medir la relación existente
entre las variables correlacionadas.
Se agregan tres columnas
más.
x y xy x y 2 2

Σx Σy Σxy Σx2 Σy2

Se sustituyen los valores en el coeficiente Pearson.


Ejercicios. Calcula el coeficiente de
correlación Pearson
Edad Respuestas
(x) inadecuadas
(y)
2 11
3 12
4 10
5 11
5 9
7 3
9 8
10 3
11 6
11 5

También podría gustarte