ESTADÍSTICA PARA
INVESTIGADORES EN
CIENCIAS SOCIALES
CON SPSS
Jhon F. de la Cerna Villavicencio
Licenciado en Estadística - UNMSM
EL CURSO SE LLEVA BÁSICAMENTE BAJO LA
ESTRUCTURA DEL CURSO BRINDADO POR EL PORTAL
ESTADÍSTICA PARA
INVESTIGADORES: TODO LO QUE
SIEMPRE QUISO SABER
OBJETIVOS DEL CURSO
Acercar a los investigadores, en un lenguaje
asequible, las herramientas básicas de análisis
estadístico de datos, que les permitirán realizar
una lectura comprensiva de la metodología
estadística en las publicaciones científicas y
hacer una interpretación correcta de las salidas
del ordenador para incluir análisis estadísticos en
sus trabajos. Realizando el análisis estadístico
con el programa IBM Spss.
¿QUÉ VAMOS A ESTUDIAR?
Semana 1: Estadística Descriptiva: Tablas estadísticas y
Tratamiento gráfico (Organización de los datos en forma
tablas y gráficos)
Semana 2: Estadística Descriptiva: Medidas de Síntesis (La
estadística descriptiva de la muestra)
Semana 3: Análisis de la relación entre dos variables
cuantitativas: Correlación y Regresión (Estudio de relaciones
entre dos variables)
Semana 4: Análisis de la relación entre dos variables
cualitativas: Test Chi Cuadrado (Análisis de las tablas de
contingencia)
Semana 5: Análisis de la relación entre dos variables una
cualitativa y otra cuantitativa
Semana 6: Test no paramétricos: U de Mann-Whitney y Test
de Wilcoxon
Semana 7: Test no paramétricos: Test de Kruskal-Wallis y
Test de Friedman
¿QUÉ ES LA ESTADÍSTICA?
Ciencia que trata sobre la recopilación,
organización, presentación, análisis e
interpretación de información, con apoyo
matemático, a través de estudios investigativos
científicamente diseñados y realizados con el
objetivo de tomar decisiones respecto a un
problema.
Comprende dos áreas:
ESTADÍSTICA DESCRIPTIVA
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA DESCRIPTIVA
Rama de la estadística que se encarga de describir un
conjunto de datos recopilados en una muestra.
Se realizan los siguientes procesos en una muestra:
Recopilación de datos
Organización y tabulación de los datos recopilados
Presentación de los datos en tablas y gráficas (Ayuda
a resumir e interpretar los datos)
Análisis estadístico (Aplicación de medidas
estadísticas tales como: Tendencia Central, Posición,
Variación)
Interpretación del análisis estadístico
ESTADÍSTICA INFERENCIAL
Es la rama de la estadística que utiliza información
obtenida del estudio de una muestra para hacer
inferencias sobre la población.
Comprende la aplicación de una serie de técnicas
estadísticas especializadas que permiten inferir las
características de la población.
CONCEPTOS BÁSICOS
Unidad de Análisis
Es el objeto indivisible sobre la base del cual se obtienen
los datos.
Población
Es el conjunto de elementos (personas, plantas,
organismos, objetos, etc.) que contienen una o más
características comunes observables de naturaleza
cualitativa o cuantitativa, acerca del cual deseamos
obtener conclusiones o tomar decisiones.
Ejemplo:
Los estudiantes de la Facultad de Derecho y Ciencia
Politica – UNMSM matriculados en el periodo
académico 2016-2
CONCEPTOS BÁSICOS
Parámetro
Es una medida utilizada para describir alguna
característica de la población y, para conocer su
valor, es necesario utilizar la información de toda la
población.
Ejemplo:
La edad promedio (μ) de todos los estudiantes de la
Facultad de Derecho y Ciencia Politica – UNMSM
matriculados en el periodo académico 2016-2
CONCEPTOS BÁSICOS
Muestra
Es una parte de la población, seleccionada de
acuerdo a un plan o regla con el fin de obtener
información acerca de la población de la cual
proviene. La muestra debe ser representativa de la
población.
Ejemplo:
Los estudiantes del 7mo. ciclo de la Facultad de
Derecho y Ciencia Politica – UNMSM matriculados
en el periodo académico 2016-2
CONCEPTOS BÁSICOS
Estadística o estadígrafo
Es una medida utilizada para describir alguna
característica de la muestra.
Ejemplo:
La edad promedio (𝑋) de loss estudiantes del 7mo.
ciclo de la Facultad de Derecho y Ciencia Politica –
UNMSM matriculados en el periodo académico
2016-2
Dato
En un hecho numérico o no, con información
relativa a una situación que se desea analizar en
un proceso de investigación.
CONCEPTOS BÁSICOS
Variable
Es una característica de la población o muestra en
estudio que puede tomar diferentes valores. Todas las
variables tienen una escala de medida. Una variable
puede ser clasificada como cualitativa o cuantitativa.
Cualitativas: son variables que denotan una cualidad o
atributo y solo pueden ser clasificadas en categorías o
clases mutuamente excluyentes y exhaustivas.
Cuantitativas: Son aquellas variables que se
obtuvieron de un proceso de conteo (discretas) o
medición (continuas).
CONCEPTOS BÁSICOS
Clasificación de las variables Cualitativas de
acuerdo a su escala de medición:
Nominal: Son clasificadas en categorías, sin
importar el orden. No tiene sentido hacer
operaciones aritméticas con ellas (género, grupo
sanguíneo, Fuma (si/no))
CONCEPTOS BÁSICOS
Clasificación de las variables Cualitativas de
acuerdo a su escala de medición:
Ordinal: Las categorías se pueden arreglar en
orden, pero las distancias entre las clases no son
iguales (intensidad del dolor, escolaridad, nivel
socioeconómico)
CONCEPTOS BÁSICOS
Clasificación de las variables Cuantitativas de
acuerdo a su escala de medición:
Intervalo: Son medidas en las que las distancias
entre los valores es significativa pero no existe un
cero absoluto (el cero no es ausencia de atributo).
No tiene sentido hacer cociente o producto
(temperatura, usos horarios).
CONCEPTOS BÁSICOS
Clasificación de las variables Cuantitativas de
acuerdo a su escala de medición:
Razón: Las proporciones y razones tienen sentido
al determinar cuánto mas tiene una unidad que
otra de alguna característica. (peso, ingreso,
rendimiento)
ORGANIZACIÓN DE LOS DATOS
BASES DE DATOS
Codificación
Codificar datos es asignar números a las
modalidades observadas o registradas de las
variables que constituyen la base de datos, así
como asignar código (valor numérico) a los valores
faltantes (aquellos que no han sido registrados u
observados). Ejemplo: Si la base de datos incluye la
variable Sexo, hay que asignar un número a las
mujeres y otro a los hombres. Si se trata de
variables cuantitativas, hay que definir el número
de decimales que van a ser registrados.
ORGANIZACIÓN DE LOS DATOS
BASES DE DATOS
Valores atípicos
Son observaciones cuyos valores son muy diferentes a las
otras observaciones del mismo grupo de datos. Los datos
atípicos son ocasionados por:
a) Errores de procedimiento.
b) Acontecimientos extraordinarios.
c) Valores extremos. Por ejemplo, una muestra de datos del
número de cigarrillos consumidos a diario contiene el valor 60
porque hay un fumador que fuma sesenta cigarrillos al día.
d) Causas no conocidas.
Los datos atípicos distorsionan los resultados de los análisis,
y por esta razón hay que identificarlas y tratarlos de manera
adecuada, generalmente excluyéndolos del análisis.
ORGANIZACIÓN DE LOS DATOS
BASES DE DATOS
Valores faltantes
Son aquellos que no constan debido a cualquier
acontecimiento, como por ejemplo errores en la
transcripción de los datos o la ausencia de disposición a
responder a ciertas cuestiones de una encuesta. Los
datos pueden faltar de manera aleatoria o no aleatoria.
Los datos faltantes aleatorios pueden perturbar el
análisis de datos dado que disminuyen el tamaño de las
muestras y en consecuencia la potencia de las pruebas
de contraste de hipótesis. Los datos faltantes no
aleatorios ocasionan, además, disminución de la
representatividad de la muestra.
ORGANIZACIÓN DE LOS DATOS
BASES DE DATOS
Valores faltantes - Tratamiento
Métodos de imputación
Los métodos de imputación consisten en estimar los
valores ausentes en base a los valores válidos de
otras variables y/o casos de la muestra. La
estimación se puede hacer a partir de la
información del conjunto completo de variables o
bien de algunas variables especialmente
seleccionadas. Usualmente los métodos de
imputación se utilizan con variables métricas (de
intervalo o de razón), y deben aplicarse con gran
precaución porque pueden introducir relaciones
inexistentes en los datos realas.
ORGANIZACIÓN DE LOS DATOS
BASES DE DATOS
Valores faltantes - Tratamiento
Métodos de imputación
Principales procedimientos:
Sustitución por la Media. Consiste en sustituir
el valor ausente por la Media de los valores válidos.
Este procedimiento plantea inconvenientes como:
Dificulta la estimación de la Variancia.
Distorsiona la verdadera distribución de la
variable,
Distorsiona la correlación entre variables dado
que añade valores constantes.
ORGANIZACIÓN DE LOS DATOS
BASES DE DATOS
Valores faltantes - Tratamiento
Métodos de imputación
Sustitución por constante. Consiste en sustituir los valores ausentes
por constantes cuyo valor viene determinado por razones teóricas o
relacionadas con la investigación previa. Presenta los mismos
inconvenientes que la sustitución por la Media, y solo debe ser utilizado
si hay razones para suponer que es más adecuado que el método de la
media.
Imputación por regresión. Este método consiste en estimar los
valores ausentes en base a su relación con otros variables mediante
Análisis de Regresión.
Inconvenientes:
Incrementa artificialmente las relaciones entre variables.
Hace que se subestime la Variancia de las distribuciones.
Asume que las variables con datos ausentes tienen relación de alta
magnitud con las otras variables.
ORGANIZACIÓN DE LOS DATOS
DISTRIBUCIÓN DE FRECUENCIAS
Las distribuciones de frecuencias son tablas en que
se dispone las modalidades de la variable por filas.
En las columnas se dispone el número de
ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que
contienen los datos.
ORGANIZACIÓN DE LOS DATOS
DISTRIBUCIÓN DE FRECUENCIAS
La frecuencia absoluta (fi) para una clase
particular es el número de observaciones que caen
en cada clase.
ORGANIZACIÓN DE LOS DATOS
DISTRIBUCIÓN DE FRECUENCIAS
La frecuencia relativa o porcentaje para una
clase particular es su frecuencia absoluta entre el
número total de observaciones
ORGANIZACIÓN DE LOS DATOS
DISTRIBUCIÓN DE FRECUENCIAS
GRÁFICAS - VARIABLES CUALITATIVAS
Diagrama de sectores. Consiste en un círculo
subdividido en áreas cada una de las cuales es
proporcional a la frecuencia de la modalidad que
representa.
GRÁFICAS - VARIABLES CUALITATIVAS
Diagrama de barras: Consiste en un conjunto de
barras (tantas como modalidades de la variable)
cuya altura es proporcional al número de
frecuencias de la modalidad.
¿Qué deporte practicas?
GRÁFICAS - VARIABLES CUANTITATIVAS
Variables discretas : Diagrama de barras.
GRÁFICAS - VARIABLES CUANTITATIVAS
Variables continuas
Histograma: Semejante al diagrama de barras, la
diferencia consiste en que las barras son adyacentes, lo
cual indica que el nivel de medición es de intervalo,
cuando menos.
Polígono de frecuencias: Se obtiene uniendo con
líneas rectas los puntos medios de los rectángulos del
histograma.
Curva suavizada: Aproxima mediante la línea curva
los vértices del histograma. La curva suavizada tiene
por finalidad visualizar la forma de la distribución
eliminando la variación ocasionada por los datos
particulares con que se trabaja.
GRÁFICAS - VARIABLES CUANTITATIVAS
Variables continuas - Histograma
APLICACIONES EN EL IBM SPSS
TABLAS DE FRECUENCIAS
El procedimiento Frecuencias genera tablas de
frecuencias que muestran el número y el porcentaje de
los casos de cada valor observado de una variable.
Elija en los menús:
Analizar / Estadísticos descriptivos / Frecuencias...
Seleccione las variables con las que desee hacer la tabla
y muévalas hasta la lista Variable(s).
Pulse en Aceptar para ejecutar el procedimiento.
APLICACIONES EN EL IBM SPSS
GRÁFICAS
Puede visualizar gráficamente la información en una
tabla de frecuencias con un gráfico de barras o con un
gráfico de sectores.
Vuelva a abrir el cuadro de diálogo Frecuencias.
Pulse en Gráficos.
APLICACIONES EN EL IBM SPSS
Seleccione Gráficos de barras y, a continuación, pulse en
Continuar. Pulse en Aceptar en el cuadro de diálogo
principal para ejecutar el procedimiento.
REFERENCIAS
Gómez, D. (2006). Estadística descriptiva con soporte
de SPSS y MATLAB. San Marcos. Lima.
Avila Acosta, R. (2000). Estadística elemental. Edit.
RA Lima.
Estadística para investigadores: Todo lo que siempre
quiso saber. Miriada. (4.ª edición).
https://miriadax.net/web/estadistica-investigadores