Conceptos
▪ Unidad Experimental: es en quién se va a medir la variable (persona/objeto)
▪ Población: totalidad (conjunto de mediciones que le interesa al investigador)
▪ Muestra: es una parte de la población (subconjunto de mediciones seleccionado de la población)
▪ Dato: es el resultado de las mediciones
▪ Dato univariado: cuando se mide una sola variable en una sola unidad experimental
- Ej: si se mide la temperatura corporal en 148 personas
▪ Dato bivariado: cuando se miden dos variables en una sola unidad experimental
▪ Dato multivariado: cuando se miden más de dos variables
- Ej: si se miden 5 variables en estudiantes universitarios
▪ Las variables cualitativas producen datos que se pueden clasificar de acuerdo a similitudes o
diferencias de clase, a esto se le llama datos categóricos.
- Ejemplo: Clasificación de gusto excelente, bueno, regular, malo
▪ Variable discreta: puede tomar sólo un número finito o contable de valores
▪ Variable continua: puede tomar infinitamente muchos valores correspondientes a los puntos en
un intervalo de recta.
* Los años se toman como variable continua
Ejemplo de variables cualitativas y cuantitativas
- El uso más frecuente de su horno de microondas (recalentar, descongelar, calentar, otros)
Cualitativa
- El número de consumidores que se niegan a contestar una encuesta por teléfono
Cuantitativa discreta
- La puerta escogida por un ratón en un experimento de laberinto (A, B o C)
Cualitativa
- El tiempo ganador para un caballo que corre en el Derby de Kentucky
Cuantitativa continua
- El número de niños en un grupo de quinto grado que leen al nivel de ese grado o mejor
Cuantitativa discreta
Tabla estadística
Gráfica de pastel
se usa para mostrar las relaciones de las partes con respecto al todo. Muestra la forma en que
están distribuidas las medidas entre las categorías.
Gráfica de barras
se usa para destacar la cantidad real o frecuencia para cada categoría. Una gráfica de barras en la
que las barras están ordenadas de mayor a menor se denomina gráfica de Pareto.
Ejercicio unidades experimentales (pg.14 1.3)
Identificar las unidades experimentales en los que se miden las variables siguientes:
Ejercicio Tipo de Variables
Gráfica de líneas
Cuando una variable cuantitativa se registra en el tiempo a intervalos (ej. diario, semanal,
mensual, semestral o anual), el conjunto de datos forma una serie de tiempo. Los datos de una
serie de tiempo se presentan con más efectividad en una gráfica de líneas con el tiempo como eje
horizontal.
La idea es tratar de distinguir un patrón o tendencia que sea probable de continuar en el futuro
y luego usar ese patrón para hacer predicciones precisas para el futuro inmediato.
Gráfica de puntos
Para un conjunto pequeño de mediciones, por ejemplo: el conjunto 2, 6, 9, 3, 7, 6, se puede
simplemente graficar las mediciones como puntos en un eje horizontal.
Gráfica de tallo y hoja
Para crear el tallo y hoja, se divide cada observación entre las unidades y decenas. El número de la
izquierda es el tallo y el de la derecha es la hoja.
- Ejemplo:
Reordenamiento
Histograma de Frecuencia Relativa
Es una gráfica de barras en la que la altura de la barra muestra con qué frecuencia relativa las
mediciones caen en una clase o subintervalo en particular. Como regla práctica, el número de
clases debe ser de 5 a 12; cuantos más datos haya, más clases se requieren.
Fórmula para sacar las clases: mayor menos el menor entre lo que diga la tabla
dependiendo del tamaño de la muestra.
Ejemplo (pg. 25 y 26, tabla 1.10)
Peso de 30 bebes al nacer
Ejercicio pg. 50 1.11
Número de visitas a la semana a Starbucks
Probabilidad
Para sacar la probabilidad se divide lo que yo quiero entre las opciones que tengo
𝒍𝒐 𝒒𝒖𝒆 𝒚𝒐 𝒒𝒖𝒊𝒆𝒓𝒐
𝒍𝒂𝒔 𝒐𝒑𝒄𝒊𝒐𝒏𝒆𝒔 𝒒𝒖𝒆 𝒕𝒆𝒏𝒈𝒐
Con base al ejercicio anterior
- ¿Cuál es la probabilidad de que venga una persona 8 veces?
1
25
= .04 = 4%
- ¿Cuál es la probabilidad de que vayan 5 veces o más?
* Se suman las frecuencias a partir de 5 en adelante
8+7+3+1 19
= = .76 = 76%
25 25
Unidad 2
► Medidas numéricas:
▪ Parámetro: cuando se asocia con una población
▪ Estadística: cuando se calculan a partir de las muestras.
► Medidas de Centro
Son medidas a lo largo de un eje horizontal que localizan el centro de la distribución
▪ Media (promedio)
Se representan como: Fórmula para la media: Ejemplo:
- Media de la muestra 𝑥̅ Ʃ𝑥 n= 5 mediciones 2, 3, 6, 5, 8
𝑥̅ = 24
𝑛 𝑥̅ = 2+3+6+5+8= 5 𝑚𝑒𝑑𝑖𝑐𝑖𝑜𝑛𝑒𝑠 = 4.8
- Media del promedio μ
- La media muestral es un estimador para la media poblacional. Aun cuando cambia la media
muestral de una muestra a otra, la media poblacional sigue igual.
▪ Mediana (el de en medio)
Es el valor de la posición media en el conjunto de mediciones ordenada de menor a mayor, se
representa con la m
Si al ordenar las mediciones de
- Ejemplo: para encontrar la mediana en un conjunto de mediciones
menor a mayor hallamos dos cifras
2, 9, 11, 5, 6
se utilizará la siguiente fórmula:
Hay que ordenar las n= 5 mediciones de menor a mayor
2 5 6 9 11
2, 5, 6, 9, 11
m m=
6+9
= 7.5
2
▪ Moda (el número que más se repite)
- Es la categoría que se presenta con más frecuencia o el valor de x que se presenta con más
frecuencia.
- Cuando las mediciones en una variable continua se han agrupado como histograma de frecuencia
o de frecuencia relativa, la clase con el pico más alto o frecuencia se llama clase modal, y el punto
medio de esa clase se toma como la moda.
- Es posible que una distribución de mediciones tenga más de una moda a esto se le conoce como
distribución bimodal. Estas modas aparecerían como “picos locales” en la distribución de
frecuencia relativa.
► Medidas de variabilidad
Pueden ayudarnos a crear una imagen mental de la dispersión de los datos.
▪ Rango
Se define como la diferencia entre la medición más grande y la más pequeña
Dato más grande – Dato más pequeño = rango
▪ Desviación (cuanto se aleja cada dato de la media)
Cuanto se desvía de la media, se hace a partir de la media
(𝑥ᵢ − 𝑥̅ ) Fórmula
(5 - 3.8) = 1.2 Da cero (1.2) ² = 1.44
- Ejemplo: (7 – 3.8) = 3.2 Hay que elevarlo (3.2) ² = 10.24
19 (1 – 3.8) = - 2.8 al cuadrado para (2.8) ² = 7.84
5, 7, 1, 2 , 4 𝑥̅ = = 3.8
5 (2 – 3.8) = - 1.8 que no nos de (1.8) ² = 3.24
(4 – 3.8) = .2 cero (.2) ² = .04
Total = 22.80
22.80
Varianza: lo que ya = 4.56 Desviación 2
está al cuadrado se
5
Estándar (S) √4.56 = 1.39
Esto ya sería Esto ya sería
divide entre n la varianza - es cuando se le
quita la raíz a la la desviación
- se representa con σ estándar
varianza
▪ Percentil
Posición relativa en porcentaje (el conjunto de datos está dividido en 100 partes, o sea el 100%)
- Existe otra forma de dividir el conjunto de datos llamada Cuartil (entre 4 partes)
O sea entre 4 partes. Se representan como (Q₁, Q₂, Q₃, Q₄)
- El segundo cuartil ( 𝑄2 ) corresponde con la mediana porque es el de en medio y corresponde
con el 50avo percentil (el que está en el centro)