ESTADÍSTICA
DESCRIPTIVA
E INFERENCIAL
UPSLP
PRIMAVERA 2018
1
Definiciones básicas
Población: Conjunto de elementos que se quiere estudiar.
• Habitantes de una ciudad.
• Televisores fabricados en una factoría.
• Alumnos de primero de bachillerato.
Muestra: Cualquier subconjunto de una población. El
número de elementos de una muestra se llama tamaño.
Variable estadística : Cada uno de los rasgos o
características que se quiere estudiar de los elementos de
la población, susceptible o no de medida.
• Color del pelo: negro, castaño, rubio o pelirrojo
• Sexo: hombre o mujer
• Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 ,
• Alturas de alumnos:178, 169, 172, 183, …
2
Definiciones básicas
Individuo: Cada uno de los elementos que componen una
población y/o muestra .
• Es sinónimo de unidad básica o última del muestreo
Carácter : Propiedad o cualidad que presentan los
elementos de una población que se desea estudiar .
• Cualitativo cuando no puede medirse numéricamente
• Cuantitativo cuando puede medirse numéricamente (Variable)
Estadístico : Es una medida descriptiva de una muestra
• Ingreso promedio de los trabajadores
• Frecuencia de venta de productos
3
Tipos de Estadística
• La Estadística descriptiva o deductiva:
– Trata del recuento, ordenación y clasificación de
los datos obtenidos de las observaciones:
• Construcción de tablas, gráficos y cálculo de parámetros.
• La Estadística inferencial o inductiva:
– Utiliza los resultados de la estadística
descriptiva y se apoya en el cálculo de
probabilidades para la obtención de
conclusiones sobre una población a partir de los
resultados obtenidos de una muestra.
4
Variables cualitativas y cuantitativas
Ordinales • Escalas
• Etapas
Cualitativas
(Cualidades ,
• Colores
categorías o • Lugares
atributos) Nominales
• Profesiones
Variables Discretas • Número de hijos
(Unidades • Páginas de un libro
Cuantitati vas completas )
(Aquellas
medibles • Edad
numéricamente) Continuas • Peso
(Cualquier • Talla
valor en un • Tiempo
rango)
5
Tipos de Variables Cualitativas
Dicotómicas: Sólo hay dos categoría, que son excluyentes una
de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre
Nominal: tiene mas de dos categorías y no hay orden entre
ellas.
Ejemplo: color de los ojos, grupo sanguíneo
Ordinal: tiene varias categorías y hay orden entre ellas.
Ejemplo: grado tumoral, calificación del riesgo en
anestesia.
6
Tipos de Variables Cuantitativas
Continuas: números infinito no numerables de
elementos. Tiene asociado el concepto de medida, en
unidades a veces fraccionarias.
Ejemplo: Presión arterial, Edad, peso.
Discretas: números finitos o infinitos numerables de
elementos. Se asocia con el concepto de conteo.
Ejemplo: N° de hijos, N° de casos de
tuberculosis por estado.
7
Presentaciones estadísticas y
representaciones gráficas
Son los métodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la máxima
información con una rápida visualización , manejo de
estética y sencilléz operativa . Pueden ser de dos tipos:
• Tablas:
• Forma sencilla y clara de agrupar la información
• Pueden ser sencillas o complejas según la cantidad de datos
• Es importante el manejo lógico de la disposición
• Gráficos:
• Permiten visualizar la información y sus relaciones
• Es una forma ilustrativa y clara de los datos
• Es una forma creativa y artística de presentación
8
Diferentes tipos de medidas
Las descripciones numéricas de datos son
importantes. Dado un conjunto de n
observaciones :
x1 , x2 ,....., xn
La estadística descriptiva nos ayuda mediante el
manejo de medidas de tendencia central
relativas a la posición de los datos y medidas de
dispersión relativas a la variabilidad de los datos.
9
Medidas de Tendencia Central
Las medidas descriptivas más comunes de
tendencia central o posición son: la media
aritmética y la mediana
Existen otras medidas de tendencia central que en
ocasiones pueden resultar de interés tales como :
la moda, los cuartiles, los deciles, los percentiles, la
media armónica, la media geométrica y la media
ponderada.
10
Media Aritmética
La media aritmética es simplemente el promedio
(también llamada media muestral ya que
generalmente se calcula en relación a una muestra).
Se calcula de la siguiente forma: si las
observaciones de una muestra de tamaño n son x1,
x2,…,xn entonces:
n
x
x 1 x 2 ... x n i 1
i
X
n n
11
Mediana
La mediana se suele definir como el valor “más
intermedio o central ” una vez que los datos han sido
ordenados en forma creciente. Se suele denotar por
Me. La forma más general de calcular la mediana es la
siguiente: x n 1 2 si n es impar
Me x
n 2 x ( n 2) 1
si n es par
2
12
Moda
La moda de un conjunto de observaciones es el valor
que más se repite, aquel cuya frecuencia absoluta es
máxima.
Puede ser única, que haya más de una, o que no
exista.
Cuando hay más de una , la distribución de los datos
se denomina acorde : bimodal , trimodal, polimodal,
etc.
13
Uso de : Media , Mediana y Moda
Nos brindan una idea muy clara de la “posición” de los
parámetros dentro de una distribución de datos.
• La media tiene el uso más frecuente y sencillo ,
tales como : talla media del mexicano,
temperatura histórica promedio , etc.
• La mediana es representativa en poblaciones
heterogéneas , tales como : distribución de
salarios , peso medio, etc.
• La moda literalmente tiene que ver con “estar de
moda” o lo que más se lleva , tal como: número de
individuos por casa en México, cantidad de
usuarios de ciertos equipos celulares , etc.
14
Relación entre : Media,Mediana y Moda
La forma de distribución de las observaciones puede variar , causando
desviaciones de estas mediciones centrales , por eso es conveniente el
empleo conjunto de la media y la mediana en una población o muestra.
La media se usa para distribuciones simétricas que
no tienen sesgo , mientras que la mediana es más
representativa cuando se tienen datos de
distribución sesgada.
15
Medidas de
LasDispersión
medidas descriptivas más
comunes de dispersión son: el
rango, la varianza y la desviación
estándar .
Existen otras medidas de
dispersión que en ocasiones
pueden resultar de interés tales
como : rango semi-intercuartilar ,
rango percentilar y coeficiente de
variación.
16
Rango
El rango de la muestra es la medida de variabilidad más sencilla entre todas las mencionadas
Como valor se define como la diferencia entre la observación más grande y la más pequeña :
Indica el ancho, recorrido o amplitud de valores . Tiene como sus límites el valor mayor y el menor en la
distribución de datos.
r xmax xmin
17
Varianza
Es una medida significativa de la dispersión de las
observaciones alrededor de la media.
Se define como el promedio de las desviaciones respecto
a su media , elevadas al cuadrado :
n n
(x x)
i
2
(x x)
i
2
s
2 i 1
s 2 i 1
n n
18
Desviación estándar
Es una medida significativa de la dispersión de las
observaciones alrededor de la media.
Se define como la raíz cuadrada del promedio de las
desviaciones respecto a su media , elevadas al cuadrado ;
es decir la raíz cuadrada de la varianza :
(x x)
i
2
i 1
n
19
Utilidad de las medidas de dispersión
Las medidas centrales solo nos indican el valor medio
alrededor del cual se agrupan nuestros datos , pero las de
dispersión nos detallan la variación de las observaciones en
cuanto a forma y extensión.
Nos muestran claramente la distancia entre los datos y la
media aritmética, además de que dependen de todas las
observaciones.
Son únicas de una serie de datos y por eso se denominan
absolutas , pero pierden sentido de comparación , para lo
cual hay que usar el coeficiente de variación (desviación
estándar sobre
la media en porcentaje) .
20
BIBLIOGRAFÍA
1) Spiegel, Murray R. y Stephens, Larry J. (2001).
Estadística serie Schaum. México: McGraw-Hill, pp. 1 –
124
2) Domínguez, Jorge. (2009). Estadística y probabilidad. El
Mundo de los datos y el azar. México: Oxford University
Press. Unidad 3: Resumen y organización de datos, pp. 76
a 129.
21