La estadística matemática
Es la escala previa en el estudio de la estadística desde un punto de vista
puramente formal, usando la teoría de la probabilidad y otras ramas de
la matemática tales como álgebra lineal y análisis matemático. La
estadística matemática trata de la obtención de información a partir de
los datos. En la práctica tales datos contienen cierta aleatoriedad o
incertidumbre (metrología)incertidumbre. La estadística trabaja con
estos datos usando los métodos de la teoría de la probabilidad.
La estadística matemática se divide en:
Estadística descriptiva: parte que se encarga de describir los datos, esto
es, de realizar un resumen y describir sus propiedades típicas.
Inferencia estadística: parte que elabora conclusiones a partir de una
muestra de los datos, en otras palabras, comprueba el ajuste de los
datos a determinadas condiciones y proporciona una medida de la
bondad de los mismos en términos probabilísticos.
La estadística matemática es la base teórica para muchas prácticas en la
estadística aplicada.
Función de la Estadística
Las técnicas de análisis estadístico tienen una función general en la
investigación psicológica de carácter empírico (empírico: Basado en
evidencia observable), y es la de obtener información de los datos. Más
específicamente, la Estadística cumple una función descriptiva, (permite
precisar las características psicológicas de individuos y grupos), y
además, generaliza esas características a las poblaciones de interés
(Estadística Inferencial). Las técnicas estadísticas hacen posible la
contrastación de las teorías sobre el comportamiento con la evidencia
empírica expresada en datos
Conceptos estadísticos
Variable: Característica que puede presentar distintas modalidades. Por
ejemplo, la variable "género" solo presenta dos modalidades (mujer y
hombre), y la variable "depresión" presenta un número infinito de
modalidades, (las magnitudes de gravedad con que puede afectar a las
personas).
Constante: Característica que presenta una sola modalidad
Datos: Son números que representan las modalidades de las variables. Por
ejemplo, el 1 puede representar la modalidad "Mujer", el 6.3 representa
una de las magnitudes que podemos registrar en la variable "grado de
conocimiento de las técnicas estadísticas". Los datos pueden ser
clasificados según diferentes criterios, uno de los cuales se basa en las
modalidades que presentan: Se dirá que son datos dicotómicos los que
provienen de variables que solo admiten dos modalidades (por ejemplo la
variable "género"), son datos dicotomizados aquellos que presentan dos
categorías pero provienen de variables con más de dos modalidades (por
ejemplo datos con valores 1 y 0 que representan aprobado y suspenso).
Población: Conjunto completo de indivíduos, objetos o fenómenos.
Muestra: Subconjunto de la población.
Muestreo: Procedimiento de selección de las muestras.
Tipos de muestreo
Tipos de muestreo
Los tipos de muestreo se dividen en dos categorías: probabilísticos y no
probabilísticos. ¡Veamos de qué se trata cada uno!
Tipos de muestreo, muestreo en estadística
¿Qué es el muestreo probabilístico?
El muestreo probabilístico analiza y estudia una población utilizando la
selección aleatoria, simplemente porque en un grupo de individuos
todos tienen la misma oportunidad de ser elegidos. A su vez, esta
categoría se divide en:
Muestreo aleatorio simple: este tipo de muestreo elige al azar cada
individuo que hará parte de la muestra y todos tienen las mismas
oportunidades de ser seleccionados.
Por ejemplo: si hay 400 universidades, eligen 20 aleatoriamente que
cumplan ciertas características, tales como edificios con árboles,
banderas, entrada de vidrio y grandes ventanas.
Ejemplo de muestreo aleatorio
Muestreo sistemático: este muestreo selecciona de forma aleatoria al
primer individuo de la población que hará parte del estudio y luego,
define un intervalo para completar la muestra.
Por ejemplo: en un grupo de 1000 personas desean obtener una
muestra de 100 personas. El primer seleccionado es el número 2 (en
azul). A partir de este y, mediante un intervalo de 4 personas decidido
por el investigador, se seleccionarán los siguientes individuos. De esta
manera, serán los números 6, 10, 14,18, 22, etc., hasta completar la
muestra de 100 individuos.
Ejemplo de muestreo sistemático
Este muestreo asegura una selección equitativa de la población, lo que
resulta muy útil y rápido, además permite que la población esté
correctamente representada.
Muestreo por conglomerados: se utiliza cuando no se pueden estudiar
todos los individuos de una población porque es muy grande o se
encuentra dispersa en un área geográfica muy extensa, lo que aumenta
el costo de la investigación.
Es útil cuando la población se encuentra agrupada previamente y de
estos grupos se extraen los individuos para conformar la muestra.
Por ejemplo: imagina que necesitas realizar una investigación sobre la
población de tu país. Como es un poco difícil llegar a cada habitante,
aprovechas la división que ya existe por ciudades o por estados.
Entonces, eliges 100 personas o 50 por cada zona de manera aleatoria
para conformar la muestra.
Ejemplo de muestreo por conglomerados
Muestreo estratificado: el muestreo estratificado divide la población en
subgrupos o estratos que comparten ciertas características. Luego,
utilizando el método del muestreo aleatorio simple, se eligen individuos
de cada estrato para conformar la muestra.
Por ejemplo: una empresa necesita averiguar cuántas personas
consumen jugo de naranja en Puerto Rico. La persona encargada de
realizar el estudio decide utilizar el muestreo estratificado.
Entonces, divide la población en diferentes estratos, en este caso, por
edades. De cada estrato toma un porcentaje de personas y con ellas
conforma una muestra de 100.000 personas para el estudio del jugo de
naranja.
Ejemplo de muestreo estratificado
¿Qué es el muestreo no probabilístico?
El muestreo no probabilístico es una técnica que selecciona las personas
que harán parte de la muestra de una manera subjetiva, esto quiere
decir, según la decisión del investigador, evitando hacerlo al azar.
A diferencia en el muestreo probabilístico, donde cada individuo de la
población tiene las mismas oportunidades de ser seleccionado, en el
muestreo no probabilístico no todas las personas pueden participar.
El muestreo no probabilístico es menos estricto y depende en su mayoría
de la experiencia de los investigadores. Se divide en:
Muestreo de bola de nieve: esta técnica ayuda a los investigadores a
encontrar muestras cuando son difíciles de localizar. Es útil si el tamaño
de la muestra es pequeño y no está disponible fácilmente.
Por ejemplo: si eres un investigador y estás buscando personas con cierta
enfermedad, lo que haces es contactar a uno o dos individuos que
presenten dicha condición médica y que ellos mismos sean quienes te
recomienden a otros individuos con una historia médica parecida.
Muestreo por cuotas: este método permite dividir la población en
grupos o estratos que comparten características como el sexo, la edad,
los estudios, etc., y de ellos se selecciona una muestra proporcional y
representativa.
Por ejemplo: en una empresa grande quieren saber cuáles son los
hobbies preferidos por sus empleados. Como son tantas personas,
deciden dividirlas en dos estratos, por género: hombres y mujeres.
Las mujeres representan el 40 % de los empleados y los hombres el 60
%, por lo tanto, el investigador decide que en la muestra se incluirán 400
mujeres y 600 hombres para tener un total de 1000 individuos en el
estudio. Así, asegura que la participación de cada género es proporcional
a la población que representan. A esos porcentajes elegidos se les llama
cuotas.
Muestreo intencional o por conveniencia: con este método las muestras
se seleccionan basándose únicamente en el conocimiento y la
credibilidad del investigador. En otras palabras, los investigadores eligen
solo aquellas personas que ellos creen que son los adecuados para
participar en un estudio de investigación, ya sea porque son fáciles de
reclutar o porque los consideran buenos representantes de la población.
Representatividad de la muestra: Las muestras son partes de la población,
pero no son la población completa. Por ello, sus características no suelen
coincidir con las de la población. La medida en que la muestra aproxima
a la población se denomina representatividad.
Sesgo: Es la discrepancia entre las características de las muestras y las de
la población.
Análisis univariado: Analiza una sola variable. Es más sencillo, más fácil
de entender y de interpretar. En cambio, la sencillez puede comportar una
simplificación excesiva de la realidad. Por ejemplo, un investigador
quiere hacer un estudio del rendimiento académico universitario, para lo
cual recoge las calificaciones de los estudiantes en los exámenes finales.
Es claro que una caracterización del rendimiento basada exclusivamente
en las calificaciones académicas es incompleta y que, si queremos
conocer los condicionantes del rendimiento deberíamos incluir otros
variables (como actitud, preparación previa, etc.) y estudiar cómo
interactúan para dar cuenta de las variables de interés.
Análisis multivariado: Analiza los datos teniendo en cuenta las relaciones
entre las variables. Es más complejo y de comprensión más dificultosa,
pero proporciona información más completa del objeto estudiado.
El proceso de investigación
La investigación se realiza en varias etapas o fases que deben ser
coherentes entre sí. Las principales fases de la investigación empírica
son: Las preguntas/el problema, las hipótesis, selección de método,
definición y medición de las variables, diseño (selección de muestras), el
análisis de datos y la interpretación y valoración de resultados (el
informe).
Variables
Una vez definidas las cuestiones y enunciadas las hipótesis, la siguiente
fase requiere una selección adecuada de las variables relevantes para
dar respuesta a las cuestiones planteadas. La correcta definición de las
variables es esencial para toda investigación, y si se trata de investigación
empírica (basada en la evidencia observable) las definiciones de las
variables deben ser operativas.
Principales tipos de variables
Cuantitativas y cualitativas. Las modalidades de las variables
cuantitativas admiten la relación "mayor que". En cambio, las
modalidades de las variables cualitativas no lo admiten. Por ejemplo, la
modalidad 50 de la variable "peso" indica mayor magnitud de la
característica que la modalidad 40. En cambio, las modalidades de la
variable "tipo de trabajo" no tienen relación cuantitativa (un tipo de
trabajo no es más o menos que otro tipo).
Discretas y continuas. Las variables continuas admiten cualquier valor, las
discretas no. Ejemplos: La variable "depresión" es continua, y la variable
"número de amigos" es discreta (porque no puede presentar valores
fraccionados, con decimales).
Medición
Las variables tienen características diferenciadas según el tipo de
medición con que obtenemos los datos, lo cual es un factor
determinante para la selección de técnicas estadísticas de análisis de
datos.
Medir es asignar números a objetos o sucesos de acuerdo a un conjunto
de reglas previamente establecidas, y su finalidad es obtener datos lo
más válidos y precisos que sea posible. El proceso de medición es
imprescindible y previo al de análisis de datos. Las reglas de medición
especifican el procedimiento de asignación de números a las
modalidades de la variable (codificación).
El siguiente es un ejemplo sencillo de medición: Una psicóloga desea
obtener datos que representen la opinión de un grupo de pacientes
sobre la efectividad de una terapia psicológica, y para ello elabora un
cuestionario en que pide a cada paciente que marque el enunciado que
representa su opinión. La primera fase del proceso de medición consiste
en efectuar un listado de las modalidades de respuesta, y la segunda
consiste en asignar un número a cada modalidad. Las modalidades de
respuesta son:
La regla de codificación consiste en asignar un 1 a la modalidad
"absolutamente en contra", un 2 a la modalidad "bastante en contra", un
3 a la modalidad "indiferentes", un 4 a la modalidad "bastante a favor" y
un 5 a la modalidad "Completamente a favor".
Supongamos que las respuestas obtenidas por la psicóloga son:
A continuación se codifica las respuestas, que quedan transformadas en
los siguientes datos, que ya pueden ser analizados con procedimientos
estadísticos:
Principales escalas de medida:
a) Nominal. Les objetas son clasificado en categorías mutuamente
exhaustivas y excluyentes. Ejemplo: Preguntamos a un grupo de
individuos el tipo de deporte que practican, y codificamos las respuestas
de acuerdo con la siguiente regla:
Los datos obtenido son:
Estos datos expresan que el primer individuo practica el fútbol, el
segundo montañismo, el tercero baloncesto, etc. (La anterior medición
habría sido incorrecta de no haber incluido la categoría "otros", porque
la regla de codificación habría excluido las actividades deportivas no
incluidas en las cuatro primeras categorías).
b) Ordinal. Este tipo de medición tiene las características de la medición
nominal, y además admite la relación "mayor que". Ejemplo: Medición
que consiste al atribuir el 1 al primero que llega en una carrera ciclista, el
2 al que llega en segundo lugar, el 3 al que llega en tercer lugar, etc.
c) De intervalo. Este tipo de medición tiene las características de la
medición ordinal, y además separa las unidades de medición por
intervalos equivalentes. Ejemplo: Los tiempo de llegada a la carrera
ciclista (expresados como minutos) están definidos de forma que la
diferencia entre 5 y 4 (60 segundos) es la misma que la que va del 2 al 3,
o del 7 al 8 (60 segundos).
d) De razón. Este tipo de medición tiene las características de la medición
de intervalo, y además tiene la propiedad de que el 0 es real. Ejemplo:
Número de veces que un individuo sonríe. (El 0 indica ninguna sonrisa).
Métodos y diseños
Una vez definidas las cuestiones a que se desea dar respuesta, las
variables y el procedimiento e instrumentos de medición, la siguiente
fase consiste en especificar cómo se va a asignar los sujetos participantes
a las unidades de observación (muestras y muestreo). En general,
método significa al procedimiento de realización de una actividad. La
expresión "método científico" puede utilizarse con carácter general para
referirse al procedimiento para generar conocimiento científico, pero
también se utiliza para referirse a conjuntos de técnicas particulares.
El método general que se viene aplicando en ciencias empíricas (basadas
en evidencia observable) como Psicología es el hipotético-deductivo, que
se aplica en las siguientes etapas: Fase 1. El punto de partida son
cuestiones que se desea dar respuesta o problemas que se desea
resolver, para lo cual se elabora una hipótesis explicativa. Fase 2:
Deducción de consecuencias verificables de las hipótesis. Las
consecuencias son contrastadas con la evidencia para establecer si ésta
respalda las hipótesis explicativas. Si no es así se considera que las
hipótesis están equivocadas, total o parcialmente. El método científico
general difiere según el tipo de investigación, el objeto a que se aplica y
el tipo de cuestiones a que se quiere dar respuesta.
Métodos
La investigación realizada con métodos descriptivos es denominada
investigación descriptiva, y tiene como finalidad definir, clasificar,
catalogar o caracterizar el objeto de estudio. Cuando tiene la finalidad de
conseguir descripciones generales diremos que es de tipo nomotético, y
cuando la finalidad es la descripción de objetos específicos diremos que
es idiográfica. Los métodos descriptivos pueden ser cualitativos o
cuantitativos. Los métodos cualitativos se basan en la utilización del
lenguaje verbal y no recurren a la cuantificación. Los principales métodos
de la investigación descriptiva son el observacional, el de encuestas y los
estudios de caso único.
Observacional
La investigación observacional consiste en registrar el comportamiento
en el entorno habitual del sujeto. Características: a) definición precisa de
las condiciones de observación, b) sistematización y objetividad y, c)
rigor en el procedimiento de registro del comportamiento. Los métodos
observacionales pueden ser con intervención o sin intervención. La
observación sin intervención tiene por finalidad observar el
comportamiento tal como ocurre de forma natural, y en ella el
observador se limita a registrar lo que observa, sin manipular ni
controlar.
Encuestas
La investigación con encuestas se caracteriza por utilizar cuestionarios
para registrar las respuestas de los sujetos. La finalidad más habitual de
la investigación con encuestas es la descripción de pensamientos,
opiniones y sentimientos. Procedimientos: Correo, entrevistas
personales, teléfono, Internet. Correo: El principal inconveniente es el
sesgo introducido por el elevado índice de encuestas no contestadas,
especialmente si piden datos de tipo personal. Entrevistas personales: la
principal ventaja es el grado de control del investigador a la obtención de
respuestas. Inconveniente: sesgo del experimentador y coste económico.
Teléfono: la principal ventaja es la simplicidad del procedimiento.
Inconveniente: Dificultad de que la muestra sea representativa dada la
relación entre selección de sujeto, variedad de operadores telefónicos o
falta de teléfono. Internet: la principal ventaja es la facilidad de llegar a
muestras grandes, y las principales desventajas son la dificultad por
trabajar con muestras representativas y la falta de control del proceso.
Cualitativo
Tiene por objeto de estudio el comportamiento en su ámbito natural, y
se propone desvelar el significado del comportamiento más que su
cuantificación.
Métodos correlacionales o asociativos
La investigación correlacional o asociativa tiene por finalidad establecer
relaciones de concomitancia o covariación entre variables en base a las
cuales podemos hacer predicciones. Las predicciones obtenidas con
métodos correlacionales no tienen valor causal dado que se basan en la
ocurrencia conjunta de los hechos o variación simultánea de las
variables, y no podemos decir que la variación en la variable de la que
hacemos las predicciones es ocasionada por la variable predictora.
Métodos experimentales
Las características específicas de la investigación experimental son la
manipulación de la variable independiente y el control de las variables
perturbadoras. La variable independiente es aquella cuya manipulación
es seguida de variación en la variable dependiente. Las variables
dependientes son aquellas que cambian como consecuencia de la
manipulación de la variable independiente, es decir "dependen" de la
variable independiente. Se denomina proceso interveniente el
mecanismo por el que la variable independiente influye en la variable
dependiente (por ejemplo, la depresión es el proceso o variable
interviniente que explica la relación entre variables independientes (por
ejemplo acontecimientos negativos) y dependientes como la tristeza. Las
variables perturbadoras son aquellas que producen efecto en la variable
dependiente pero no son las variables independientes. Para evitar que
sus efectos confundan las conclusiones hay que controlarlas, lo que
generalmente se consigue mediante la aleatorización de la asignación de
los indivíduos a las condiciones experimentales. La investigación
experimental tiene valor causal si cumple las siguientes condiciones:
variación conjunta de las variables independientes y dependientes,
temporalidad (la variación en las variables dependientes tiene que
ocurrir después de la manipulación de las variables independientes) y la
neutralización de otros posibles causas excepto la que es manipulada.
Análisis de datos
El análisis de datos tiene por finalidad obtener la información contenida
a los datos y que es necesaria por dar respuesta a las cuestiones
planteadas. En la etapa de interpretación y valoración de resultados se
interpreta los resultados obtenidos en el análisis y se da una primera
respuesta a las cuestiones planteadas de acuerdo a los resultados, se
valoran en relación a la teoría, se plantea nuevas explicaciones
hipotéticas y se sugiere nuevas investigaciones.
Escalas de medición
En estadística, existen cuatro tipos de escalas de medición de datos:
nominal, ordinal, de intervalo y de razón. A continuación te
detallaremos cada una:
1. Escala nominal
La escala nominal se utiliza para etiquetar variables sin ningún valor
cuantitativo, son mutuamente excluyentes (no se superponen) y ninguna
de ellas tiene significado numérico.
Una buena manera de recordar todo esto es que «nominal» suena
mucho como «nombre» y las escalas nominales son algo así como
«nombres» o etiquetas.
2. Escala ordinal
En la escala ordinal, lo importante y significativo es el orden de los
valores, pero no se conocen realmente las diferencias entre cada uno de
ellos.
«Ordinal» es fácil de recordar porque suena como «orden» y esa es la
clave que hay que recordar con las «escalas ordinales»: lo que importa
es el orden, pero eso es todo lo que se obtiene de ellas.
3. Escala de Intervalo
La escala de intervalo es una escala numérica en la que conocemos tanto
el orden como las diferencias exactas entre los valores.
El ejemplo clásico de una escala de intervalo es la temperatura Celsius
debido a que la diferencia entre cada valor es la misma.
Las escalas de intervalo son agradables porque se abre el ámbito del
análisis estadístico de estos conjuntos de datos. Por ejemplo, la
tendencia central puede medirse mediante la media, la mediana y la
moda; también puede calcularse la desviación estándar.
Al igual que los demás, puedes recordar los puntos clave de una escala
de intervalo con bastante facilidad. «Intervalo» significa en sí mismo
«espacio intermedio», que es lo importante a recordar: las escalas de
intervalo no sólo nos hablan del orden, sino también del valor entre cada
elemento.
Conoce más acerca de los niveles de medición y cómo aplicarlos
4. Escalas de razón
La escala de razón arroja el valor exacto entre las unidades y también
tienen un cero absoluto, lo que permite aplicar una amplia gama de
estadísticas tanto descriptivas como inferenciales.
Todo lo anterior sobre los datos de intervalo se aplica a las escalas de
razón, y además las escalas de razón tienen una clara definición de cero.
La escala de razón o escala proporcional ofrece una gran cantidad de
posibilidades en lo que respecta al análisis estadístico. Estas variables
pueden sumarse, restarse, multiplicarse y dividirse de forma significativa.
Escalas comparativas y no comparativas
En el mundo de la investigación se han desarrollado un sin fin de escalas
de medición, y algunos de los investigadores las clasifican en dos: Escalas
comparativas y escalas no comparativas.
Ahora te presentaremos las 4 escalas de medida más importantes dentro
de la clasificación de “No comparativas”, y que son más sencillas de
comprender. Te sorprenderá lo fácil que es su uso.
1. Escala gráfica de medición de datos
En cada extremo de esta escala gráfica se colocan valores opuestos y se
le pide a los encuestados que marquen mediante deslizamiento el punto
que más se acerque a su opinión.
Una escala de proporción gráfica, también conocida como escala de
proporción continua, se ve normalmente así:
Escala grafica de medición de datos
Algunos investigadores usan números a lo largo de la barra, la razón de
esto es para analizar más rápido los resultados.
2. Escala Likert
La escala de Likert contiene un número impar de opciones,
popularmente se usan cinco o siete y se etiqueta un extremo como muy
negativo y el otro como muy positivo, incluyendo una etiqueta de
“Neutral” en medio de la escala.
escala de Likert
Puedes utilizar frases como: “Muy insatisfecho – Muy satisfecho” o
“Totalmente en desacuerdo – Totalmente de acuerdo”.
Conoce estos 5 ejemplos de escalas Likert
3. Escala de diferencial semántico (Max Diff)
Una escala diferencial es una combinación de diferentes conceptos,
normalmente contiene un número impar de características a calificar y
se etiquetan ambos extremos con valores opuestos.
4.- Matriz de lado a lado de análisis de datos
Otro de los tipos de escalas de medición que se utiliza popularmente en
las encuestas es la matriz de lado a lado y la forma más común de
hacerlo es evaluando importancia / satisfacción.
Matriz de lado a lado de análisis de datos
Este tipo de escalas de medición se usa principalmente para investigar
qué características incluir en tus productos o para evaluar las
características más importantes ya existentes.
Usando un buen software para encuestas podrás aprovechar todo el
poder de este tipo de escala.
Te recomiendo leer: Max-diff, una de las escalas de medición más
importantes
4. Matriz de lado a lado de análisis de datos
Otro de los tipos de escalas de medición que se utiliza popularmente en
las encuestas es la matriz de lado a lado y la forma más común de
hacerlo es evaluando importancia / satisfacción.
Primero pregunta a tus encuestados cuál es la importancia que ellos le
dan a cada característica, después pregunta el nivel de satisfacción con
respecto a la misma característica.
En algunas herramientas se puede incluir la lógica de bucle que te
permitirá realizar la pregunta varias veces con otras alternativas que
podría tomar en cuenta el encuestado. Esto te ayudará a obtener datos
de referencia que permitarán comparar el rendimiento entre
características.
Gh