Bases de
la
estadístic
a
ESTADÍSTICA
• Disciplina matemática cuyo objeto es la interpretación de un conjunto de
datos numéricos que se extraen de hechos empíricos.
• Estudia fenómenos, ocupándose de recoger y ordenar gran número de datos
con el fin de obtener alguna consecuencia.
• Rama de la matemáticas que se ocupa de reunir, organizar y analizar los
datos numéricos con el propósito de sacar conclusiones y tomar decisiones
con relación a dicho análisis.
Disciplina de recolectar, organizar, presentar, analizar e interpretar los datos con el propósito de ayudar a
una toma de decisiones más efectiva.
ESTADÍSTICA
Ciencia de recolectar, organizar, presentar, analizar e interpretar los datos con el propósito de ayudar a una
toma de decisiones más efectiva.
Descriptiva Diferencial
Recolecta, organiza,
resume y presenta datos Hacer predicciones y
referentes a un fenómeno comprobaciones a partir de una
en forma informativa muestra sobre una población y
obtener conclusiones
Describe y analiza una muestra,
sin buscar sacar conclusiones Induce o infiere las formas de
de forma general comportamiento de una
población, para predecir
Las conclusiones se obtienen conclusiones respecto a una
son a partir de la muestra. No información.
Las conclusiones se obtienen
se aplican leyes de probabilidad
son a partir de la población. Se
aplican leyes de probabilidad.
DESCRIPTIV
A
Nos permite conocer la distribución de los datos a partir de la
cuantificación de los atributos de una categoría o variable.
Funciones: a) conocer el tipo de distribución; b) representación
gráfica; obtener medidas de tendencia central y d) calcular medidas
de variabilidad.
*Medidas de tendencia central.
*Medidas de dispersión
*Medidas de distribución.
Tipo de
Distribución
Relativa (fr%) Ajustada (fa%) Acumulada (fa)
Absoluta (f)
Recalcula las frecuencias
relativas y absolutos cuando Ordena de mayor a
Describe objetos Ordena objetos en % hay datos perdidos menor o viceversa
Medidas de
Tendencia central
Medidas de
Calcular la media
tendencia central
Medidas de
Calcular la mediana
tendencia central
Medidas de
Tendencia central
Medidas de
Tendencia central
- Rango
- Varianza Medidas de
- Desviación Estándar
Dispersión
Las medidas de dispersión son importantes en la descripción de la distribución
de los datos, debido a que indican el grado en que varían con relación a la parte
central de la curva normal.
Se aplica a medidas intervalares.
• Rango
• Desviación estándar
• Varianza
• Sesgo
• Curtosis
• Error estándar
Las medidas de dispersión se relacionan con la mayor o
menor concentración de datos en torno al valor central
(generalmente media)
Datos Cuantitativos
- Rango
Medidas de
Dispersión
También conocido como recorrido. Es la distancia entre el valor mínimo y el valor máximo de
una distribución.
No requiere de formula.
Se puede aplica a medidas ordinales e intervalares.
Ejemplo: conocer el rendimiento escolar de 42 alumnos donde la calificación más alta fue 9 y la
más baja fue 2. El rango se obtiene restando la calificación más alta –la más baja (9-2=7). El
rango es igual a 7.
x
x
1 Rango
x
2 R max(xi ) min(xi )
x
n
Datos Cuantitativos
- Desviación estándar. Medidas de
Dispersión
• También conocida como desviación típica y desvío típico
• Representada por la letra griega minúscula sigma σ (para la población/parámetro)
• la letra latina s (estimador de la muestra), así como por las siglas SD (de standard
deviation) o DT (para la muestra)
• Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de
datos numéricos
Desviación
estándar
Una desviación estándar baja Una desviación estándar alta
indica que la mayor parte de los indica que los datos se extienden
datos de una muestra tienden a sobre un rango de valores más
estar agrupados cerca de su amplio.
media. La curva se ve más achatada
La curva se ve más aguda y alta
Desviación
estándar
Ejemplos de aplicación
diagnósticos nutricionales o
evaluaciones cognitivas
Desviación
estándar
Ejemplos de aplicación
diagnósticos nutricionales o
evaluaciones cognitivas
Desviación
estándar
Ejemplo: Calcular la desviación estándar del número de
hijos en una muestra de 176
1. Se obtiene distribución de frecuencias (f) =176
Desviación
estándar
Ejemplo: Calcular la desviación estándar del número de
hijos en una muestra de 176
1. Se obtiene distribución de frecuencias f =176
2. Se multiplica cada frecuencia (f) por el
número de hijos fx=379
Desviación
estándar
Ejemplo: Calcular la desviación estándar del número de
hijos en una muestra de 176
1. Se obtiene distribución de frecuencias
(f)
2. Se multiplica cada frecuencia (f) por el
número de hijos fx=379
3. Para obtener la fx2, se multiplica la fx por
el número de hijos.
Desviación
estándar
Ejemplo: Calcular la desviación estándar del número de
hijos en una muestra de 176
1. Se obtiene distribución de frecuencias f=176
2. Se multiplica cada frecuencia (f) por el
número de hijos fx=379
3. Para obtener la fx2, se multiplica la fx por el
número de hijos.
4. Para obtener la media se retoma el punto 2
Desviación
estándar
Ejemplo: Calcular la desviación estándar del número de
hijos en una muestra de 176
1. Se obtiene distribución de frecuencias f=176
2. Se multiplica cada frecuencia (f) por el
número de hijos fx=379
3. Para obtener la fx2, se multiplica la fx por el
número de hijos.
4. Para obtener la media se retoma el punto 2
5. Una vez que se tiene la X (2.15), se eleva al
cuadrado -4.62.
Actividad
● A partir de los datos proporcionados en la tabla, calcula las
siguientes medidas de tendencia central y de dispersión lo
siguiente en una hoja de Excel.
● Media de edad
● Mediana de edad
● Rango
● Desviación estándar
Datos Cuantitativos
- Varianza
Medidas de
Dispersión
Es la desviación estándar al cuadrado (s 2 o σ2)
Indica una distancia con respecto a la X,
Su aplicación es el análisis de varianza (Anova) e indica cuánto de la variabilidad de la
variable dependiente es explicada por la variable independiente.
¿Qué tanto la variabilidad de la variable dependiente es explicada por las diferencias de los
individuos (varianza de error)
Datos Cuantitativos
- Varianza
Medidas de
Dispersión
Es la desviación estándar al cuadrado (s 2 o σ2)
Indica una distancia con respecto a la X,
Su aplicación es el análisis de varianza (Anova) e indica cuánto de la variabilidad de la
variable dependiente es explicada por la variable independiente.
¿Qué tanto la variabilidad de la variable dependiente es explicada por las diferencias de los
individuos (varianza de error)
Datos Cuantitativos
- Sesgo
Medidas de
Dispersión
Se refiere a la variación de una distribución.
Se le conoce como sesgo o asimetría.
En SPSS, lo encontrarán como asimetría
Los coeficientes de asimetría indican si hay el mismo número de elementos a la izquierda y
derecha de la media.
Datos Cuantitativos
- Sesgo
Medidas de
Dispersión
¿En qué nos ayuda?
Nos permite identificar si los datos se distribuyen de manera uniforme
alrededor del punto central de la media aritmética
Datos Cuantitativos
- Sesgo
Medidas de
Dispersión
Curva asimétrica Curva simétrica Curva asimétrica
positiva negativa
Cuando la mayor cantidad de datos
Cuando la mayor cantidad de datos Hay el mismo número de datos a
se aglomera en los valores
se encuentra por encima del valor izquierda y derecha de la media
menores que la media
de la media aritmética aritmética
aritmética
Datos Cuantitativos
- Sesgo
Medidas de
Dispersión
¿En qué nos ayuda?
Nos permite identificar si los datos se distribuyen de manera
uniforme alrededor del punto central de la media aritmética
Se refiere a la variación de una distribución.
Grado de asimetría de una distribución observada por el número de casos agrupada en una
sola dirección.
Se interpreta de acuerdo al valor y al signo
Datos Cuantitativos
- Sesgo: variación
distribución
de una
Medidas de
Dispersión
Sesgo negativo
Sesgo positivo
Actividad
1. A partir de los datos proporcionados en la tabla, calcula lo
siguiente en una hoja de Excel.
● Varianza
● Asimetría o sesgo
2. Grafica en Excel ( de dispersión o barras) donde se identifique la
curva y señala con tres líneas verticales: la media, mediana y
moda.
Datos Cuantitativos
- Curtosis
Medidas de
Dispersión
Curtosis (k).
También se puede encontrar como kurtosis o apuntamiento.
Es el nivel de picudez de una curva. Su grado de elevación o aplanamiento
Datos Cuantitativos
- Curtosis
Medidas de
Dispersión
Leptocúrtica- Platicúrtica-
ocurre cuando los datos están Mesocúrtica- los datos están ampliamente
agrupados en un intervalo ocurre cuando los datos tienen esparcidos, una curva
estrecho (dispersión pequeña) una distribución moderada aplanada (dispersión amplia)
Datos Cuantitativos
- Curtosis
Medidas de
Dispersión
Leptocúrtica-
ocurre cuando los datos están
agrupados en un intervalo
estrecho (dispersión pequeña)
Índice mayor que 0
Mesocúrtica-
ocurre cuando los datos tienen
una distribución moderada
Índice = 0
Platicúrtica-
los datos están ampliamente
esparcidos, una curva
aplanada (dispersión amplia)
Índice menor que 0
- Curtosis Datos Cuantitativos
Medidas de
Dispersión
Similitudes entre sesgo y curtosis
Nos permiten identificar la asimetría en una curva
Sesgo Curtosis
Indica la asimetría hacía uno u otro lado Indica la asimetría a través de la elevación
- Error estándar
Medidas de
Dispersión
Diferencia entre la media muestral y la media poblacional (m o X)
Forma de
distribuciones
INFERENCIA
L
La estadística inferencias se basa en
la prueba de hipótesis
Conjunto de técnicas que permiten al investigador obtener
conclusiones a partir de una muestra para después ser
generalizadas a una población (parámetros).
Principal función es la generalización en una población en términos
de población, habitualmente en términos de probabilidad a partir de
las conclusiones obtenidas, resultados de la manipulación de
variables en muestras observadas.
INFERENCIA
L
Aplicaciones:
1) Comparar parámetros. Un parámetros es cualquier
característica de una población.
2) Aplicar pruebas de hipótesis
Estadística inferencial: Aplicar pruebas de hipótesis
Tipos de
hipótesis
HIPÓTESIS
Conceptual Trabajo Estadísticas
Derivado del marco teórico, parte Estas hipótesis se refieren a Nulas y alternas
de una teoría, un modelo teórico o lo que esperar encontrar el 1) Implican relación entre
un metanálisis. Hipótesis investigador a partir de un variables
planteadas por otro investigador. marco teórico 2) Se plantean solo cuando
se ocupa la estadística.
Estadística inferencial: Aplicar pruebas de hipótesis
Tipos de
hipótesis
HIPÓTESIS
Conceptual Trabajo Estadísticas
Derivado del marco teórico, parte Estas hipótesis se refieren a Nulas y alternas
de una teoría, un modelo teórico o lo que esperar encontrar el 1) Implican relación entre
un metanálisis. Hipótesis investigador a partir de un variables
planteadas por otro investigador. marco teórico 2) Se plantean solo cuando
se ocupa la estadística.
A mayor frustración mayor Existe relación entre el
agresión (Dollar et al. aprovechamiento escolar y
1939) la autoestima.
Estadística inferencias: Aplicar pruebas de hipótesis Tipos de
hipótesis
Estadística inferencias: Aplicar pruebas de hipótesis Tipos de
Ejemplo hipótesis de comparación hipótesis
d i No
f e ha
re
nc y
ia
s
N
r e o ha
la
ció y
n
Ejemplo hipótesis de relación
Estadística inferencias: Aplicar pruebas de hipótesis
Tipos de
hipótesis
Ejemplo hipótesis de comparación SIN
dirección Ejemplo hipótesis de comparación CON
dirección
Si hay diferencias.
No sabemos quién N
tiene mayor r e o ha
la
calidad de vida si ció y
solteros o casados n
pero HAY
DIFERENCIAS
Estadística inferencias: Aplicar pruebas de hipótesis Tipos de
Ejemplo hipótesis de relación con dirección
hipótesis
A
m
m ayo
en r /
or
Actividad
1. A partir de los datos que obtuviste en el estudio que realizaste
para la evaluación parcial, elabora 4 pares de hipótesis
estadísticas (nulas y alternas).
2. Pueden ser 2 de comparación y 2 de relación ya sea con dirección
o sin dirección.
3. Las hipótesis varían de acuerdo a los objetivos planteados.
4. Elabóralas en un documento de Word y conviértelo en PDF.