ESTADISTICA
DEFINICIÓN
Para definir la Estadística es preciso mencionar que su objetivo es
recopilar información de orden cualitativa o cuantitativa,
perteneciente a individuos, grupos, hechos o fenómenos, y
deducir a partir del análisis de los datos respuestas a
interrogantes o proyecciones futuras.
La estadística, en general, estudia los métodos empleados en la
recolección, organización, resumen, análisis e interpretación de
datos, con el fin de obtener validez en las conclusiones y tomar
decisiones de manera razonable y efectiva
CATEGORÍAS
La estadística persigue una finalidad orientada al análisis de datos
de forma secuencial; sin embargo, para efectos de su estudio, se
habla de dos tipos: estadística descriptiva y estadística
inferencial.
La estadística descriptiva está orientada a la presentación de
datos mediante tablas y gráficas que permiten resumir o describir
el comportamiento de los mismos, sin realizar inferencias sobre
ellos debido a que son obtenidos de una parte de la población.
La estadística inferencial, en cambio, se deriva de la muestra, de
mediciones u observaciones que se han hecho a una parte
representativa de la población, por lo cual busca establecer
generalidades para la población a partir de los datos obtenidos.
En consecuencia, la estadística inferencial investiga o analiza una
población a partir de la muestra seleccionada, utilizando técnicas
adecuadas del muestreo.
UNIDAD DE ANÁLISIS O DE INVESTIGACIÓN
La unidad de análisis o de investigación es el elemento al cual se
investiga. Éste puede ser un objeto, una persona, un grupo de
individuos o un acontecimiento. La unidad debe ser coherente con
el tipo de investigación que se está realizando y se debe tener en
cuenta que las características que posea el elemento no sean
ambiguas, sean entendibles y que permitan mediciones y
comparaciones
POBLACIÓN
La población o universo es un conjunto de elementos a los cuales
se le estudian algunas características comunes; por ejemplo, los
docentes de una institución educativa, las empresas de un sector
productivo, los barrios de una ciudad, los artículos vendidos en un
supermercado, las calificaciones de una prueba de aptitud, entre
otros.
La población puede ser finita o infinita. Se estima que una
población es finita cuando el número de los elementos que la
integran es conocido por el investigador; tal es el caso de los
barrios de una ciudad, los docentes de una universidad, los
operarios de una industria, etc., mientras que para la población
infinita no se conoce el número de elementos, ya sea porque es
muy grande o porque se sabe que existe pero no se conoce el
tamaño, por ejemplo: los lanzamientos de un dado, el número de
veces que una persona puede pasar por un sitio y demás.
MUESTRA
La muestra se define como un conjunto de elementos
seleccionados adecuadamente, que pertenecen a una población
determinada, o sea que es una parte de la población o universo. Al
seleccionar una muestra se pretende que el análisis realizado en
ella pueda proporcionar conclusiones similares a las que se
lograrían si se hubiese estudiado la totalidad de elementos de la
población; por tal razón, la muestra debe ser representativa.
En la mayoría de los estudios se procura que el número de
elementos de la muestra sea cercano al número de la población
para evitar errores generados por el muestreo; sin embargo, con el
fin de optimizar recursos de tiempo, dinero, etc., se asumen los
errores generados por la diferencia en el número de unidades
entre la muestra y la población y se acude al muestreo. En los
casos en los cuales el número de elementos de la muestra es igual
al de la población, el estudio se denomina censo.
PARÁMETROS Y ESTADÍGRAFOS
Los parámetros son medidas cuantitativas que describen una
característica de la población, entre ellas están: media aritmética,
varianza y coeficiente de variación. En una población se presentan
muchas características y, en consecuencia tendrá varios
parámetros. Los estadígrafos o estadísticas son medidas
cuantitativas que describen una característica de la muestra y se
consideran estimadores para la población.
VARIABLES
Se considera como variable cualquier característica o propiedad
general de una población que sea posible medir con distintos
valores o describir con diferentes modalidades, por ejemplo: el
coeficiente intelectual de los estudiantes de un grupo puede tener
diferentes valores, o el estado civil de los empleados de una
organización puede estar caracterizado como soltero, casado,
separado, entre otros.
Así, estas dos características se consideran variables porque,
como el término lo indica, varían al medirse o caracterizarse de
una unidad de análisis a otra.
En algunos casos, las características de las unidades de análisis
pueden ser medidas, mientras que en otros solo es posible
describirlas.
Para el ejemplo anterior, el coeficiente intelectual es posible
medirse en los estudiantes, lo cual obedece a una característica
cuantitativa, y el estado civil en los empleados solo se puede
describir (no medir), por ser una característica cualitativa. En
este sentido, las variables pueden diferenciarse en dos grupos:
cualitativas y cuantitativas.
VARIABLES CUALITATIVAS
Las variables cualitativas son aquellas que representan atributos
de los elementos y no permiten una representación numérica
definida.
Sin embargo, algunas cualidades pueden ser representadas por
códigos numéricos que, en el fondo, generan categorías de orden
cualitativo.
Entre las variables cualitativas están: el estrato socioeconómico,
el estado civil, la profesión, el color de una flor, entre otras.
VARIABLES CUANTITATIVAS
Estas variables permiten una escala numérica y las características
de los elementos son observados cuantitativamente a través de
una medida y una escala definidas. Entre las variables
cuantitativas se encuentran: el salario de los empleados, la talla
de una persona, el peso, el número de hijos en una familia, el
número de artículos vendidos en un almacén, entre otros.
Las variables cualitativas y cuantitativas se representan con letras
mayúsculas del alfabeto (X, Y, Z...) y los atributos de cada variable
se simbolizan con letras minúsculas en compañía de subíndices.
Por ejemplo, la variable estado civil de los empleados en una
empresa puede ser representada por la letra X y sus posibles
atributos de “soltero, casado, separado” se representan por, x1:
soltero, x2: casado, x3: separado.
Las variables cuantitativas pueden ser clasificadas en dos grupos:
continuas y discretas.
Una variable es cuantitativa continua si a lo largo de un intervalo
puede tomar cualquier valor; es decir, entre uno y otro valor de
la variable siempre puede existir otro valor intermedio. Son
variables cuantitativas continuas la talla o altura de personas, el
peso de objetos, el salario de empleados, el tiempo dedicado a
realizar una actividad, la temperatura de un lugar, entre otras.
Tomando específicamente por ejemplo la talla en metros de un
grupo de personas, entre 1,60 m y 1,70 m, la variable puede
tomar múltiples valores, es decir no se brinca de 1,60 a 1,70 m,
sino que es posible que se ubique en 1,61; 1,62; 1,63; 1,68; 1,69
m.
Una variable es cuantitativa discreta si solo puede tomar un valor
de un conjunto de números; existen separaciones entre dos
valores sucesivos que no pueden llenarse con valores intermedios;
en este caso la variable toma valores aislados.
Por ejemplo, los empleados de una organización, artículos
vendidos en un almacén, instituciones educativas de un sector; en
estos casos, solo es posible medir la variable con valores como 15,
16, 17 u otro número entero y no con valores intermedios, tales
como 15,7 o 16,8.
ESCALAS DE MEDICIÓN
La escala de medición es considerada como un sistema que asigna
valores numéricos a características susceptibles de medir.
Normalmente, las escalas pueden ser de cuatro tipos: nominal,
ordinal, de intervalos y de razón.
ESCALA NOMINAL
La escala nominal se utiliza para representar a las variables
cualitativas (también llamadas categóricas) y determina múltiples
categorías identificadas por un nombre, que bien pudieron estar
fijadas previamente o ser precisadas por el investigador según sus
necesidades, manteniendo rigurosidad en su definición y
convirtiéndolas en elementos mutuamente excluyentes, pues las
categorías son exclusivas y solo existe una para cada elemento de
la población; algunos ejemplos: color del cabello (negro, rubio,
castaño, otro); estado de un artículo (bueno, imperfecto); género
de los estudiantes (masculino, femenino).
ESCALA ORDINAL
Esta escala se caracteriza por presentar niveles con un rango
determinado, lo que facilita la comparación entre ellos y es
posible diferenciarlos como “mayor que” o “menor que”. Es
importante resaltar que la distancia entre un nivel y otro
adyacente no es la misma. Ejemplos: estado de salud de una
persona: sano, ligeramente afectado, enfermo, muy enfermo.
Producción en una empresa: alta, media, baja.
A pesar de que los niveles se pueden representar por un número,
éste cumple la función de etiqueta y no es posible usarlo como
cantidad numérica en operaciones matemáticas, tal es el caso del
estrato socioeconómico, donde los números representan un nivel
satisfacción de necesidades y un orden definido en los sectores a
los cuales pertenece: estrato 1 < 2 < 3 < 4 < 5 < 6.
ESCALA DE INTERVALO
La escala de intervalo presenta mayor información que las escalas
nominal y ordinal. Se caracteriza por establecer de forma
ordenada los niveles y si la distancia entre uno y otro es la misma,
lo cual conlleva a usar una unidad de distancia de referencia. Por
esta razón, esta escala permite relacionar intervalos y de esta
forma se puede observar, por ejemplo, que la distancia entre 5 y 6
es la misma que existe entre 23 y 24. En esta escala se asigna el
punto cero como una medida arbitraria y no implica ausencia de la
característica que se está midiendo.
Un ejemplo típico para esta escala es la medición de la
temperatura; para ello se pueden usar varios sistemas: el Celsius,
Kelvin o Fahrenheit.
En cualquiera de estos sistemas se observa que la distancia entre
un grado y el consecutivo es la misma; además, el cero en
cualquiera de ellos no implica ausencia de temperatura.
ESCALA DE RAZONES
La escala de razones es aquella que posee más información en
relación a las escalas anteriores. Toma un cero no arbitrario
(absoluto) que significa ausencia del atributo o la característica;
esto facilita la comparación, tanto en intervalos como en razones,
en cualquier sistema de medición que se utilice.
Por ejemplo, si un elemento posee una longitud de 4,6 cm tendrá
el doble de extensión al compararse con otro elemento que mide
2,3 cm, en cualquier tipo de sistema en que se registre la longitud.
A esta escala pertenecen todas aquellas mediciones que están
relacionadas con el tiempo, longitud, superficie (áreas), capacidad
(volúmenes), peso, dinero, entre otras.
En términos generales, se denomina para cualquier escala de
medición como débil si contiene poca información, razón por la
cual restringe la aplicación de los métodos estadísticos. Mientras
que las escalas con mayor información son consideradas como
fuertes y es posible analizarlas por medio de métodos específicos
diseñados para explicar su comportamiento.
Si se clasifica de una manera más amplia, las variables cualitativas
utilizan la escala nominal, mientras que las cuantitativas emplean
las escalas de razones o de intervalo. Las variables que usan la
escala ordinal se ubican en una transición entre cualitativas y
cuantitativas.
EJERCICIOS DE APLICACIÓN
1. Establezca la diferencia entre estadística descriptiva y
estadística inferencial.
2. ¿Qué diferencia hay entre estadígrafo y parámetro?
3. ¿Cuándo se justifica realizar un censo en un estudio
estadístico?
4. En la tabla 1 se presentan las variables analizadas en un
accidente ocurrido a un grupo de empleados en una industria.
Clasifique en cada uno de los casos el tipo de variable y la
escala de medición.
TIPO DE ESCALA DE
VARIABLE CODIFICACION
VARIABLE MEDICIÓN
Edad En años cumplidos
Tiempo de antigüedad En años cumplidos
Estrato socioeconómico Bajo, medio, alto
Estado civil Soltero, casado, viudo, separado,
otro
Escolaridad Ninguna, primaria, secundaria,
universitario, posgrado, otra
Tipo de lesión presentada Múltiples opciones
Área del cuerpo afectada Extremidades, pecho, cara, otra
Grado de la lesión Leve, moderada, grave
Requirió atención médica Sí, no
Tiempo de incapacidad En días
Ha presentado previamente Sí, no
accidentes laborales
Utiliza implementos de Sí, no
bioseguridad
en su trabajo
TIPO DE ESCALA DE
VARIABLE CODIFICACION
VARIABLE MEDICIÓN
Fecha del accidente Ubicación en el
calendario (dd/mm/aaaa)
En qué jornada ocurrió el Mañana, tarde, noche
accidente
Temperatura del sitio del Temperatura en °C
accidente
Fuma Sí, no
Número de cigarrillos consumidos Nº de cigarrillos
diariamente
Consumo de alcohol Sí, no
Frecuencia de consumo de Diario, semanal, quincenal,
alcohol mensual
Personas con Amigos, familiares, pareja,
quienes consume licor compañeros
de trabajo, otros
Cociente intelectual (CI) Medido en escala de CI
Capacidad para el estudio Puntuación en un test
Barrio de residencia Múltiples opciones