PROBABILIDAD Y ESTADÍSTICA
UNIVERSIDAD TECNOLÓGICA DE PANAMÁ. PRIMER SEMESTRE DE 2023
PROFESORA: NUELY C. DE LA CRUZ LUCK. CORREO:
[email protected] / WHATSAPP: 6036-4913
MÓDULO 1: CONCEPTOS
FUNDAMENTALES
DE ESTADÍSTICA
OBJETIVOS GENERALES DEL MÓDULO
Identificar a la Estadística no como una rama de la Matemática sino como un área de
conocimiento que trata del desarrollo de una teoría práctica de la información.
Motivar a los estudiantes en el estudio de los conceptos y métodos estadísticos.
Incorporar a la visión de los estudiantes el uso del programa tecnológico Excel
aplicado a la Estadística y Probabilidad.
OBJETIVOS ESPECÍFICOS DEL MÓDULO
Entender, aprender y utilizar los conceptos y técnicas más importantes de la
Estadística Descriptiva y la Estadística Inferencial.
Diferenciar entre variables continuas y discretas.
Distinguir los diferentes niveles de medición de variables.
RECOMENDACIONES
Se sugiere que el primer paso para desarrollar el Módulo #1 sea leer compresivamente el capítulo #1 del libro
de texto que tiene en la plataforma. La lectura debe ser de manera individual y luego comente los temas leídos
con sus compañeros de equipo.
Seguido, debe revisar la presentación que se muestra a continuación e ir anotando en su cuaderno o dispositivo
tecnológico las consultas que le surjan y que no puedan ser aclaradas con sus compañeros de equipo.
Luego, aclare sus dudas con la profesora.
Resuelva los ejercicios que se encuentran en la Libreta de Trabajo como parte del Módulo 1 durante las clases
asignadas para ello y compare sus respuestas con el libro de texto.
Asista a clases, participe activamente y valide lo aprendido con otros compañeros tanto de su equipo como de
otros.
Por último, repase lo aprendido, ya estará más cerca el primer parcial y todo debe estar muy claro.
¡Éxitos!
INTRODUCCIÓN
DEFINICIONES DE ESTADÍSTICA
El termino Estadística proviene del latín statisticum collegium (“consejo de Estado”) y de
su derivado italiano statista (“hombre de Estado o político”).
La Estadística es una rama de la Matemática y es la ciencia que se encarga de recolectar
datos de una población o muestra. Los conceptos estadísticos se han trabajado
intuitivamente desde la antigüedad, las primeras culturas recopilaban datos poblacionales
por medio de censos como los realizados en Egipto por Moisés (según consta en la Biblia) y
el empadronamiento que fue efectuado por los romanos en Judea. Para que esta rama de las
Matemáticas tenga lugar y desarrolle sus trabajos deben contar con una serie de
instrumentos que se han convertido en fundamentales.
DEFINICIONES DE ESTADÍSTICA
La Estadística es la parte del Método Científico que tiene por objeto el hacer
predicciones acerca de una población en base a la información obtenida a través de
una muestra.
ESTADÍSTICA APLICADA
Se denomina estadística aplicada al área de la Estadística que se ocupa
de inferir resultados sobre una población a partir de una o varias muestras. Es la parte
de la estadística que se aplica en cualquier otra rama externa a ella, como la
comunicación, psicología, medicina, sociología, historia, biología, mercadotecnia,
entre otras.
La estadística aplicada puede ser dividida en dos ramas: la estadística descriptiva que se refiere a los
métodos de recolección, descripción, visualización y resumen de los datos, que pueden ser presentados
en forma numérica o gráfica y la estadística inferencial que usa la teoría de probabilidades para
generalizar las características de una población a partir de las características de una muestra
representativa. En otras palabras, es la generación de los modelos y predicciones relacionadas a los
fenómenos estudiados, teniendo en cuenta el aspecto aleatorio y la incertidumbre en las observaciones.
Además de la estadística aplicada, también existe una disciplina denominada estadística matemática,
que abarca las bases teóricas de la materia.
CLASIFICACIÓN DE LA
ESTADÍSTICA
LA ESTADÍSTICA SE CLASIFICA EN:
Estadística
Estadística Inferencial
Descriptiva
ESTADÍSTICA DESCRIPTIVA
Involucra los procedimientos para identificar una población objeto de estudio,
seleccionar una muestra y agrupar los datos para su posterior análisis e
ilustración en diversos tipos de gráficos.
En ocasiones un científico sólo desea obtener alguna clase de resumen del
conjunto de datos representados en la muestra.
La Estadística Descriptiva ofrece un sentido del centro de ubicación de los
datos, de la variabilidad en los datos y de la naturaleza general de la distribución
de observaciones de la muestra. A veces va acompañada por gráficas.
ESTADÍSTICA INFERENCIAL
La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones
generales para toda la población a partir del estudio de una muestra, y el grado de
fiabilidad o significación de los resultados obtenidos.
LA ESTADÍSTICA INFERENCIAL COMPRENDE:
1. Las tomas de muestras
2. La estimación de parámetros o variables estadísticas
3. El contraste de hipótesis
4. El diseño experimental
PASOS PARA REALIZAR UN PROBLEMA DE INFERENCIA
ESTADÍSTICA
Planteamiento del problema
Elaboración de un modelo
Extracción de la muestra
Tratamiento de los datos
Estimación de los parámetros
Contraste de hipótesis
Conclusiones
PERO, ¿PARA QUÉ TODO ESTO?
El objetivo del análisis estadístico es identificar tendencias.
Un negocio de venta al por menor, por ejemplo, podría utilizar
el análisis estadístico para encontrar patrones en los datos de los
clientes que se puedan utilizar para crear una experiencia más
positiva y aumentar las ventas.
CONCEPTOS ESTADÍSTICOS
POBLACIÓN
En Estadística, la población también llamada universo, es el conjunto de elementos de
referencia sobre el que se realizan las observaciones.
MUESTRA
En Estadística, una muestra es un subconjunto de casos
o individuos de una población estadística.
TIPOS DE POBLACIONES Y MUESTRAS
Ahora que tenemos claro estos conceptos y cómo debemos conocerlos para los
estudios estadísticos de toda clase, vale la pena profundizar en los tipos.
TIPOS DE POBLACIÓN
Existen dos tipos de poblaciones, finitas e infinitas. La primera incluye un número
limitado de observaciones, mientras que la población infinita, contempla un gran
conjunto de datos que no pueden alcanzarse por conteo.
EJEMPLOS DE POBLACIONES FINITAS
Número de operaciones Número de piezas
Número de estudiantes
crediticias realizadas defectuosas producidas
matriculados en el
por un banco en una en la línea de
curso
semana producción
Número de unidades de
cierto producto
vendidas en la pasada
semana
EJEMPLOS DE POBLACIONES INFINITAS
Número de unidades Número de personas
que producirá en el que habitarán en el país
futuro una máquina en los próximos 5 años
TIPOS DE MUESTRA O MUESTREO
Muestra no Muestra
probabilística probabilística
MUESTRA / MUESTREO NO PROBABILÍSTICO
Suele ser mucho más sencilla y económica de obtener. Comprende un agrupamiento de
procedimientos como muestras a juicio, muestras de cuotas y el denominado trozo de pastel.
La desventaja del modelo no probabilístico es que no hay una forma probabilística de estimar qué
tan representativas son esas muestras de la población.
Para la muestra a juicio, el entrevistador selecciona a cualquier sujeto que desee, mientras que en las
muestras de cuota la selección está restringida por varias cuotas preestablecidas en relación con
sexo, edad, raza, y otras características que tratan de simular cualidades conocidas de la población.
En cualquier caso, el entrevistador evitará elegir vecindarios pobres, áreas inaccesibles o zonas de
depresión para trabajar. Con esto, los resultados tienen un prejuicio o sesgo automático porque se
omitirán grupos enteros en el proceso de selección.
El trozo de pastel se compone de un proceso de autoselección por mera conveniencia.
EJEMPLOS DE MUESTRA NO PROBABILÍSTICA
Personas Los
que miembros de
responden a una clase en
un anuncio particular
Personas
que visitan
Personas en
una
un teatro
exhibición
particular
en un centro
comercial
MUESTRA / MUESTREO PROBABILÍSTICO
Una muestra probabilística es aquella en la cual los sujetos de la muestra se
seleccionan con base en probabilidades conocidas.
TIPOS DE MUESTREO PROBABILÍSTICO
Aleatorio
Sistemático Estratificado
Simple
Conglomerados
MUESTREO PROBABILÍSTICO – ALEATORIO SIMPLE
Muestreo aleatorio simple: muestra seleccionada de manera que cada elemento o individuo de la población tenga
las mismas posibilidades de que se le incluya.
Ejemplo: suponga que una población consta de 845 empleados de Nitra Industries. Se va a elegir una muestra de
52 empleados de dicha población. Una forma de asegurarse de que todos los empleados de la población tienen las
mismas posibilidades de que se les elija consiste en escribir primero el nombre de cada empleado en un papel y
depositarlos todos en una caja. Después de mezclarlos , se efectúa la primera selección tomando un papel de la
caja sin mirarlo. Se repite este proceso hasta terminar de elegir la muestra de 52 empleados. Un método más
conveniente de seleccionar una muestra aleatoria consiste en utilizar un número de identificación por cada
empleado y una tabla de números aleatorios como la del apéndice B.6. Como su nombre lo indica, estos números
se generaron mediante un proceso aleatorio (en este caso, con una computadora).
PARÁMETRO ESTADÍSTICO
En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse
del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente
mediante una fórmula aritmética obtenida a partir de datos de la población.
ESPACIO MUESTRAL
Conjunto de resultados elementales posibles asociado al experimento.
EJEMPLOS DE REPRESENTACIÓN
DE ESPACIO MUESTRAL
Los ejemplos que se presentarán a continuación, serán tratados con temas
relacionados con los juegos de azar. El objetivo, es el de facilitar la
comprensión del concepto y las ideas del tema tratado.
Para el desarrollo de los mismos, se utilizarán las primeras herramientas que
nos ayudarán a determinar la composición del espacio muestral en una forma
efectiva y organizada.
Ejemplo #1
Se lanzan dos monedas simultáneamente, ¿cuál es el espacio
muestral de este experimento?
Solución
El experimento consta de un ensayo formado por dos monedas, las
cuales pueden dar como resultado dos casos posibles cada una.
Para obtener el espacio muestral, podemos utilizar como
herramienta un eje de coordenadas. En el mismo, se tendrá como
instrumento a las dos monedas y como variables, las dos lecturas,
cara o sello, en cada una de ellas.
ESQUEMA GRÁFICO PARA MOSTRAR EL ESPACIO MUESTRAL
Yi
(C,S) (S,S)
S
MONEDA #2
(C,C) (S,C)
C
C S
Xi
MONEDA #1
En este caso, se cumple con el concepto de equiprobabilidad, es decir, los
eventos tienen la misma probabilidad de ocurrir.
Ejemplo #2
Se lanzan dos dados simultáneamente, ¿cuál es el espacio muestral de este
experimento?
Solución
El experimento consta de un ensayo formado por dos dados, los cuales
pueden dar como resultado seis casos posibles cada uno.
Como se trata de dos dados, podemos utilizar como herramienta el eje de
coordenadas para definir el espacio muestral. El instrumento consiste en
los dos dados y las variables se identifican como la lectura de los seis
números en cada uno de ellos.
ESQUEMA GRÁFICO PARA MOSTRAR
EL ESPACIO MUESTRAL
Yi
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
6
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
5
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
4
DADO #2
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
3
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
2
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
1
1 2 3 4 5 6
Xi
DADO #1
El espacio muestral estará formado por 36 casos posibles.
Ejemplo #3
Se lanzan tres monedas simultáneamente, ¿cuál es el espacio muestral de
este experimento?
Solución
El experimento consta de un ensayo en el cual se lanzan tres monedas, las
cuales pueden dar como resultado dos casos posibles cada una.
Recurrimos al diagrama de árbol para describir el espacio
muestral, según la secuencia lógica de los acontecimientos.
Este diagrama es de tipo secuencial, el cual parte de un origen y
describe simétricamente por etapas los resultados posibles.
Se derivan como instrumentos las tres monedas y como
variables las lecturas, cara o sello, que se identifiquen en cada
una de ellas.
MONEDA
#1 #2 #3 RESULTADOS
POSIBLES
C
CCC
C S
CCS
C
C S CSC
S
CSS
C
SCC
S C S
SCS
C
S SSC
S
SSS
MEDIDAS ESTADÍSTICAS
MEDIDAS DE POSICIÓN
En un conjunto de datos las medidas de posición están diseñadas para brindar al
analista alguna medida cuantitativa de dónde está el centro de los datos en una
muestra. También se les llama Medidas de Tendencia Central. En otras palabras,
se trata de valores de la variable estadística que se caracterizan por la posición
que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:
media, moda y mediana.
MEDIA
La media es simplemente un promedio numérico.
MODA
La moda es el dato más repetido, el valor de la variable con mayor frecuencia. Su
cálculo es extremadamente sencillo, pues sólo necesita de un recuento.
MEDIANA
El propósito de la mediana de la muestra es reflejar la tendencia central de la muestra,
de manera que no esté influida por los valores extremos.
FÓRMULAS (MEDIA Y MEDIANA) Y EJEMPLO
CÁLCULO DE MODA
Así, si disponemos de las ventas por semana del número de
tanques de gas de 25 libras en una tienda durante las últimas 10
semanas de la forma siguiente:
5 2 4 6 4 3 4 4 2 3
La moda será de 4 tanques o unidades, por ser el valor que más
se repite en la distribución.
TIPOS DE VARIABLES
VARIABLES ESTADÍSTICAS
Definición de variable: Una variable estadística es una característica que
puede fluctuar y cuya variación es susceptible a adoptar diferentes valores,
los cuales pueden medirse u observarse. Las variables adquieren valor
cuando se relacionan con otras variables. A partir de este concepto se puede
mencionar que una variable es la que permite relacionarla con algún
problema o fenómeno, el cual vamos a investigar y buscar posible
soluciones.
Se clasifican Cuantitativa
Cualitativas
en: s
VARIABLE ALEATORIA
Una variable aleatoria o variable estocástica es una función que asigna un valor,
usualmente numérico, al resultado de un experimento aleatorio. Los valores posibles
de una variable aleatoria pueden representar los posibles resultados de un
experimento aún no realizado, o los posibles valores de una cantidad cuyo valor
actualmente existente es incierto. En términos formales una variable aleatoria es una
función definida sobre un espacio de probabilidad. Una variable aleatoria puede
concebirse como un valor numérico que está afectado por el azar.
EJEMPLO
Supongamos que se lanzan dos monedas al aire. El espacio muestral, esto es, como ya
se definió, el conjunto de resultados elementales posibles asociado al experimento,
quedaría de la siguiente manera:
Donde (c representa "sale cara" y x, "sale cruz"). Podemos asignar entonces a cada
suceso elemental del experimento el número de caras obtenidas.
TIPOS DE VARIABLES ALEATORIAS
Variable aleatoria discreta
Variable aleatoria continua
VARIABLE ALEATORIA DISCRETA
Toma valores finitos y/o fijos. Una característica X es de tipo discreto cuando puede
tomar una serie de valores claramente separados x1… xk.
VARIABLE ALEATORIA CONTINUA
Una variable aleatoria es continua si su recorrido es un conjunto no numerable.
Intuitivamente esto significa que el conjunto de posibles valores de la variable abarca
todo un intervalo de números reales.
EJEMPLO
La variable que asigna la estatura a una persona extraída de una determinada
población, es una variable continua ya que, teóricamente, todo valor entre, pongamos
por caso, 0 y 2,50 m, es posible.
VARIABLES CUALITATIVAS
Son aquellas que se evalúan a través de atributos y se dividen en Nominales y
Jerarquizadas. Cabe indicar, que este tipo de variable, al no relacionarse de manera
natural como variable numérica, debe convertirse a valores numéricos antes de que se
trabaje con ellas.
VARIABLES NOMINALES
Estas se identifican en categorías o cualidades bien definidas, procediéndose a contar
el número de observaciones que quedan en cada una de ellas. Por lo general, este tipo
de variables forman parte de cuestionarios en donde el interesado selecciona uno de
los atributos que despliega como respuesta. Cabe indicar, que las respuestas se
disponen en categorías mutuamente excluyentes y colectivamente exhaustivas.
EJEMPLOS DE VARIABLES NOMINALES
VARIABLES JERARQUIZADAS
Son aquellas que se derivan de situaciones relativas para denotar un orden en la
respuesta.
EJEMPLOS DE VARIABLES JERARQUIZADAS
RESUMIENDO LOS TIPOS DE VARIABLES:
RESUMIENDO LAS POBLACIONES Y TIPOS DE VARIABLES
TIPOS DE VARIABLES O DATOS
POBLACIÓN
CONTINUOS DISCRETOS NOMINALES JERARQUIZADOS
Número Año
ESTUDIANTES Peso en libras de Género académico
estudiantes
PRODUCCIÓN Porcentaje Número Tamaño
DE de de Sabor de la
GASEOSAS azúcar rupturas botella
PRODUCTORES Demanda Número Tipo Tamaño
de de de de la
AGROPECUARIOS crédito productores productor finca
NIVELES DE MEDICIÓN DE LAS
VARIABLES
NIVELES DE MEDICIÓN DE LAS VARIABLES
Los datos se clasifican por niveles de medición. El nivel de medición de los datos rige los cálculos que
se llevan a cabo con el fin de resumir y presentar los datos. También determina las pruebas estadísticas
que se deben realizar.
Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La medición más baja, o
más primaria, corresponde al nivel nominal. La más alta, o el nivel que proporciona la mayor
información relacionada con la observación, es la medición de razón.
DATOS DE NIVEL NOMINAL
En el caso del nivel nominal de medición, las observaciones acerca de una variable cualitativa sólo se
clasifican y cuentan. No existe una forma particular para ordenar las etiquetas. No existe un orden
natural.
El género representa otro ejemplo del nivel nominal de medición.
DATOS DE NIVEL ORDINAL
Una calificación es más alta o mejor, que la siguiente: superior es mejor que bueno, bueno es mejor
que promedio, etc. Sin embargo, no es posible distinguir la magnitud de las diferencias entre los
grupos. ¿La diferencia entre superior y bueno es la misma que entre malo e inferior?
No es posible afirmarlo. Si sustituye 5 por superior y 4 por bueno, concluirá que la calificación
superior es mejor que la calificación bueno, pero si añade una calificación de superior y una de bueno
no espere que el resultado tenga significado. Además, no debe concluir que la calificación de bueno
(calificación de 4) sea necesariamente dos veces más alta que malo (calificación de 2). Sólo tendrá
claro que la calificación bueno es mejor que la calificación malo; no en qué grado es mejor
calificación.
RESUMIENDO:
Las propiedades del nivel ordinal de los datos son las siguientes:
1. Las clasificaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres
(alto, medio, bajo), las cuales tienen valores relativos.
2. En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.
DATOS DE NIVEL DE INTERVALO
El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las características del
nivel ordinal, pero, además, la diferencia entre valores constituye una magnitud constante. Un ejemplo
de nivel de intervalo de medición es la temperatura. Suponga que las temperaturas altas durante tres
días consecutivos de invierno en Boston son de 28, 31 y 20 grados Fahrenheit. Estas temperaturas se
clasifican fácilmente, aunque, además, es posible determinar la diferencia entre ellas, gracias a que un
grado Fahrenheit representa una unidad de medición constante.
EJEMPLO
Otro ejemplo de escala de intervalo de
medición consiste en las tallas de ropa
para dama. Enseguida se muestran datos
referentes a diversas medidas de una
prenda de una mujer caucásica típica.
EXPLICACIÓN DEL EJEMPLO ANTERIOR
¿Por qué razón la talla es una medición de intervalo? Observe que conforme la talla cambia 2 unidades
(de la talla 10 a la 12, o de la talla 24 a la 26), cada medida aumenta 2 pulgadas. En otras palabras, los
intervalos son los mismos.
RESUMIENDO:
Las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la característica en
cuestión.
2. Diferencias iguales en la característica representan diferencias iguales en las mediciones.
DATOS DE NIVEL DE RAZÓN
Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de razón es
el más alto. Posee todas las características del nivel de intervalo, aunque, además, el punto 0 tiene
sentido y la razón entre dos números es significativa. Ejemplos de la escala de razón de medición
incluyen salarios, unidades de producción, peso, cambios en los precios de las acciones, la distancia
entre sucursales y la altura. El dinero ilustra bien el caso. Si tiene cero dólares, entonces no tiene
dinero. El peso constituye otro ejemplo.
EJEMPLO
Observe que Lahey, padre, gana el doble de lo que
gana su hijo. En la familia de Rho, el hijo percibe el
doble de ingresos que su padre.
RESUMIENDO:
Las propiedades de los datos de nivel de razón son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a las
clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos números es significativa.
GRÁFICA RESUMEN DE LOS PRINCIPALES NIVELES DE
MEDICIÓN
OTRAS MEDIDAS DE TENDENCIA
CENTRAL
MEDIA PONDERADA
La media ponderada es una medida de tendencia central, que es apropiada cuando en un conjunto de datos cada
uno de ellos tiene una importancia relativa (o peso) respecto de los demás datos. Se obtiene multiplicando cada
uno de los datos por su ponderación (peso) para luego sumarlos, obteniendo así una suma ponderada; después se
divide esta entre la suma de los pesos, dando como resultado la media ponderada.
REALICE EL SIGUIENTE EJEMPLO
Se puede usar una media ponderada para calcular la nota final de parciales de esta asignatura, en donde se asigna
distinta importancia (peso) a los distintos exámenes que se realicen. Por ejemplo, los dos primeros exámenes
tienen un peso o valor de 30% y 20% respectivamente, y el último del 50%; las calificaciones respectivas son de
81, 75 y 95, entonces la nota final de parciales corresponde a la siguiente media ponderada:
81 x 0.30 = 24.3
75 x 0.20 = 15.0
95 x 0.50 = 47.5
86.8
RANGO MEDIO
El medio rango o rango medio de un conjunto de valores numéricos X = {x1…, xn} es la media del menor y
mayor valor, o la mitad del camino entre el dato de menos valor y el dato de mayor valor. En consecuencia el
medio rango es:
EJEMPLO
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de
mayor valor Max= 8. El medio rango resolviéndolo mediante la
correspondiente fórmula sería:
REPRESENTACIÓN DEL MEDIO RANGO