Núcleo Temático 1
Estadística Descriptiva
La Estadística es una disciplina que utiliza recursos matemáticos para
organizar y resumir una gran cantidad de datos obtenidos de la realidad, e
inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene
cuando se quiere conocer el estado sanitario de un país, el consumo de
ciertos productos alimenticios, el rendimiento estudiantil, entre otros, a través
de ciertos parámetros como la tasa de mortalidad de la población, existencia
de productos, promedios de notas, respectivamente. En este caso, la
estadística describe la muestra en términos de datos organizados y
resumidos, y luego infiere conclusiones respecto a la población.
La Estadística, se puede definir como el conjunto de métodos, normas, reglas
y principios que tienen como propósito por parte del investigador llevar a cabo
las acciones de observar, agrupar, describir, cuantificar y analizar el
comportamiento de un grupo o población en estudio. Es así como podemos
clasificar a la estadística en dos grandes grupos:
Conceptos asociados a la estadística
En términos generales, el estudio de la Estadística supone el conocimiento y
manejo de una serie de términos que nos permitirán comprender mejor el
comportamiento de los datos en estudio y realizar en forma adecuada el
análisis e interpretación de la información.
POBLACIÓN: Es el conjunto general de todos los individuos (personas,
objetos, mediciones) sobre los cuales se desea estudiar un fenómeno y que
poseen una característica particular en común. Puede ser Finita (cuando el
número de elementos pueden ser contabilizados) o Infinita (cuando una
población tiene un tamaño tan grande que no es posible para el investigador
someter todos los elementos a medición).
MUESTRA: Es un subconjunto de elementos que se extrae de la población
de estudio. Debe tener como características: la aleatoriedad, homogeneidad
y representatividad con respecto a la población. De la calidad de la muestra
depende en gran medida la veracidad y objetividad del estudio.
Tipos de muestreo
Las muestras pueden ser elegidas mediante diversas técnicas o
procedimientos. Estas técnicas se clasifican según el según como sean
elegidos los individuos.
Se dividen en dos grandes grupos:
1. Muestreo probabilístico (o muestreo aleatorio): proceso de selección
de individuos de manera que cada sujeto tiene probabilidad positiva e
independiente de ser seleccionado.
1. Muestreo aleatorio simple: 1) todos los individuos tienen la
misma probabilidad de ser elegidos, 2) las observaciones se
realizan con reemplazamiento, de forma que la población es
igual en todas las extracciones.
2. Muestreo aleatorio estratificado: los individuos se dividen en
grupos o estratos. La muestra se elige escogiendo en cada
estrato un número representativo de individuos.
3. Muestreo aleatorio sistemático: se utiliza en muestras
ordenadas. Consiste en seleccionar al azar un elemento y a
partir de él, incrementando un intervalo fijo, seleccionar toda
la muestra.
4. Muestreo aleatorio por conglomerados: la población está
dividida en conglomerados naturales (provincias, ciudades,etc.).
Se seleccionan algunos conglomerados y se toman en
representación de toda la población.
2. Muestreo no probabilístico (o muestreo no aleatorio): la selección de
los individuos se basa en el criterio del investigador. No se conoce la
probabilidad de que cada individuo sea elegido en la muestra.
1. Muestreo por cuotas: se basa en seleccionar
la muestra después de dividir la población en grupos o estratos.
Los sujetos dentro de cada grupo se eligen por métodos no
probabilísticos.
2. Muestreo por conveniencia: consiste en seleccionar a los
individuos que convienen al investigador para la muestra. Esta
conveniencia se produce porque al investigador le resulta más
fácil examinar a estos sujetos, ya sea por proximidad
geográfica, por ser sus amigos, etc.
3. Muestreo de bola de nieve (o muestreo por referidos): se realiza
sobre poblaciones en las que no se conoce a sus individuos o
es muy difícil acceder a ellos. Se llama muestreo de bola de
nieve porque cada sujeto estudiado propone a otros,
produciendo un efecto acumulativo parecido a una bola de
nieve.
4. Muestreo casual o accidental: los individuos son elegidos de
manera casual, sin ningún juicio previo. Las personas que
realizan el estudio eligen un lugar o un medio, y desde ahi
realizan el estudio a los individuos de la población que
accidentalmente se encuentren a su disposición.
5. Muestreo discrecional (o muestreo por juicio): los sujetos se
seleccionan a base del conocimiento y juicio del investigador.
Variable
Una variable estadística es cada una de las características o
cualidades que poseen los individuos de una población.
Escala de los niveles de medición
Hay cuatro tipos de mediciones o escalas de medición en estadística y estos
tienen diferentes grados de uso en la investigación estadística. Los cuatro
tipos de niveles de medición:
Análisis de escala mayormente utilizadas en los test, escalas y
cuestionarios psicológicos
ESCALAS DE ORDENACIÓN
En las escalas de ordenación, también denominadas escalas de arbitrarias o
estimación, cada individuo ordena, por orden de preferencia, objetos o
individuos en relación con una característica.
Esta disposición puede hacerse por tres procedimientos principales: por
escalas de puntos, de clasificaciones directas y de combinaciones binarias.
1. En las escalas de puntos el sujeto debe puntuar según su aceptación o
rechazo palabras entre las presentadas.
2. En la escala de ordenación, o de clasificación directa, se pide al sujeto que
ordene las palabras o conceptos de mayor a menor agrado.
3. En las escalas de comparaciones binarias se ofrece al sujeto parejas de
palabras y se le pide que selecciona cuál de las dos prefiere.
ESCALA VALORATIVA SUMATORIA
Una variación de la anterior es la escala valorativa sumatoria. Es útil para
obtener una jerarquía de objetos, personas, grupos, procesos, roles,
ocupaciones, valores, etc. en una cierta propiedad o variable. Esa propiedad
o variable puede ser el prestigio, la simpatía, la eficacia, etc.
El procedimiento es sencillo, se presentan al encuestado una serie de
objetos, grupos, etc. a jerarquizar y se le pide que puntúe a cada uno de ellos
con un número (del 1 al 5 o del 0 a 10) su valor en determinada característica
o propiedad.
Ejemplo:
La jerarquía puede obtenerse por diferentes procedimientos. El más sencillo
es calcular la media de todas las puntuaciones para cada categoría.
ESCALAS DE INTENSIDAD
Las escalas de intensidad o de apreciación estructuran las opiniones bajo
formas de respuesta en abanico, según la evolución o grados de un
continuum de actitud. Por ejemplo:
Una variación es trazar una línea graduada del 1 al 10, por ejemplo, y pedir
que marque su grado de acuerdo gráficamente.
EL ESCALOGRAMA DE GUTTMAN
En el escalograma de Guttman se le presenta al sujeto una serie de
cuestiones jerarquizadas de mayor a menor y se pide su veracidad en cada
caso. Parte de la idea de que las actitudes son “escalables” y se trata de
saber hasta dónde llega el encuestado en esa escala.
De esta forma, si un sujeto sujeto acepta una proposición se supone que
también lo hace en las inferiores a él. Por ejemplo, se pregunta su tienen
estudios universitarios, si tiene estudios medios, primarios, etc. Se entiende
que si tiene estudios universitarios tendrá todos los demás. Aquí, frente a las
escalas valorativas, es objetivo es ordenar a las personas encuestadas, no a
los objetos de estudio
Un ejemplo sobre el grado de compromiso política puede ser el siguiente:
Lo importante en esta técnica es que las preguntas estén convenientemente
jerarquizadas. Para ello ha de hacerse un estudio piloto previo.
ESCALAS DE DISTANCIA SOCIAL
Variaciones a esta técnica son las llamadas escalas de distancia social.
Tienen como objetivo establecer relaciones de distancia entre grupos. La más
extendida es la escala de Bogardus que pretendía medir la intensidad de
prejuicios nacionales y raciales. Básicamente se trata de hacer preguntas
indirectas sobre la distancia del sujeto a una minoría étnica o cultural, o una
determinada nacionalidad, etc.
Una de las diferencias es que en este tipo de escalas las preguntas suelen ir
en orden decreciente, para no influir en las respuestas de los sujetos.
Un ejemplo clásico para medir el grado de racismo es:
Escalas análogas son las de Dood, que mide actitudes respecto a grupos
nacionales, sociales o religiosos, o la de Crespi.
ESCALA DE LIKERT
En este tipo de escalas se ofrece una afirmación al sujeto y se pide que la
califique del 0 al 4 según su grado de acuerdo con la misma. Estas
afirmaciones pueden reflejar actitudes positivas hacia algo o negativas.
Las primeras se llaman favorables y las segundas desfavorables. Es muy
importante que las afirmaciones sean claramente positivas o negativas, toda
afirmación neutra debe ser eliminada.
EL DIFERENCIAL SEMÁNTICO
El diferencial semántico es un procedimiento destinado a medir la
significación que tienen ciertos objetos, hechos, situaciones o personas para
los encuestados. Concretamente se mide esa significación a partir de la
situación del concepto del objeto analizado en un espacio semántico de
dimensiones valorativas. Así, por ejemplo, el concepto de “concierto de rock”
puede tener dos significados diferentes para dos personas, A y B, en un
espacio semántico definido por las coordenadas: culturalidad y agresividad:
Para establecer el “diferencial semántico” de un objeto, situación, hecho o
persona, se proponen pares de adjetivos contrapuestos, y se pide al
encuestado que sitúa la cercanía a cada extremo del par en una escala de 7
grados.
Un ejemplo de pregunta sería:
La construcción del diferencial semántico comienza con la elección del o los
conceptos o cuestiones que se quiera analizar. Como siempre, la elección
viene determinada por los objetivos de la investigación. El siguiente paso
consiste en buscar los pares de adjetivos polares que se van a utilizar, los
cuales han de ser claramente enfrentados. Por último se escoge la escala
utilizada. Lo habitual es 5 o 7 grados. Los pares de adjetivos deben estar
situados con distintas polaridades, se trata de evitar que el encuestado
piense que uno de los lados es el “bueno” y tienda a él. Aplicando esta
técnica
se obtiene una serie de puntuaciones o posiciones espaciales para cada
sujeto, es el significado de ese concepto para cada persona. A partir de esta
información se puede localizar grupos de personas con análogos perfiles, y
relacionarlo que determinadas características sociales o personales, o con
las respuestas a otras cuestiones.
Datos estadísticos
Son números que pueden ser comparados, analizados e interpretados.
El campo del cual son tomados los datos estadísticos se identifica como
población o universo.
Resúmenes de datos:
o Cualitativos
Distribución de frecuencias
Gráficas de barra y pastel
o Cuantitativos
Distribución de frecuencias
Gráfica de puntos
Histogramas, Diagrama acumulativo
Diagrama de tallo y hojas
Métodos para datos cualitativos.
a) Organización de los datos cualitativos: Tablas
Categorías de la variable: modalidades de la variable.
Frecuencia absoluta ("f"): nº de veces que aparece una
modalidad de una variable.
Frecuencia relativa ("fr") o proporción ("p"): razón entre la
frecuencia absoluta y el nº de casos total. fr= f/n
Porcentaje ("P"): tanto por ciento correspondiente a una
modalidad de la variable.
% = fr= f/n x 100%
Ejemplo: Tabla correspondiente a la variable sexo.
Ejemplo: Representación gráfica de la variable sexo
Métodos para datos cuantitativos.
Organización de los datos cuantitativos:
Distribución de frecuencias.
Distribución de frecuencias: intervalos y sus correspondientes
frecuencias.
Intervalo: nº de valores numéricos de la variable englobados en una
clase.
o Intervalo simple o datos sin agrupar: una unidad de medida en
cada intervalo.
o Intervalo compuesto o datos agrupados: dos o más unidades de
medida en cada intervalo.
Límites:
o Límites aparentes: puntuaciones del instrumento de medida.
o Límites reales: límitesuperior ("l.s") - límite inferior ("l.i.").
o Punto medio del intervalo (Xm): Xm = (l.r.s + l.r.i) /2
o Amplitud del intervalo ("i") o Intervalo Total: magnitud del
segmento de valores que incluye.
It = l.s - l.i.
Frecuencias;
Frecuencias
Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que
aparece en la muestra dicho valor de la variable, la representaremos por ni
Frecuencia Absoluta Acunulada:
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la
variable estadística ha de ser cuantitativa o cualitativa ordenable. En otro
caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia
absoluta acumulada de un valor de la variable, es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por Ni.
Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la
muestra, al aumentar el tamaño de la muestra aumentará también el tamaño
de la frecuencia absoluta. Esto hace que no sea una medida útil para poder
comparar. Para esto es necesario introducir el concepto de frecuencia
relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la
muestra. La denotaremos por fi
Donde N = Tamaño de la muestra
Frecuencia Relativa Acumulada:
Al igual que en el caso anterior la frecuencia relativa acumulada es la
frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la
denotaremos por Fi
Porcentaje
Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante
frecuente hablar siempre en términos de tantos por ciento o porcentajes, por
lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La
denotaremos por pi.
Porcentaje Acumulado:
Análogamente se define el Porcentaje Acumulado y lo vamos a denotar
por Pi como la frecuencia relativa acumulada por 100.
Ejm. Veamos esto con un ejemplo: Tomamos para ello los datos
relativos a las personas activas.
Ejemplo.
En función de los pesos de la sección de estadística, representar los
resultados gráficamente y analizar.
Datos fabi
68,3 2
68,6 3
68,9 5
70,2 2
70,5 1
70,9 1
71,6 2
72,7 3
72,9 _ 1_
. ∑ 20