ESTADÍSTICA
Estadística Descriptiva
Es un conjunto de procedimientos que sirven para organizar, describir y sintetizar datos, sin que
las conclusiones que se extraigan de éstos rebasen su ámbito específico.
Estadística Inferencial
Es un conjunto de procedimientos que se emplean para hacer inferencias y generalizaciones
respecto a una totalidad, partiendo del estudio de un número limitado de casos tomados de
esta última.
Proceso Estadístico:
1. Establecimiento de Metas y objetivos que se requieren lograr con el proceso.
2. Recolección de Información
3. Organización de datos
4. Análisis de la información
5. Interpretación de resultados
La población o Universo es todo conjunto de personas, cosas, objetos, etc., con ciertas
características comunes que puede ser finita o infinita.
La Muestra es toda porción de elementos tomada de una población, entre más grande sea la
muestra, será más representativa de la población.
El Muestreo es el procedimiento por el cual se recopila información de los elementos de una
muestra, existen varias formas de realizar el muestreo, unas son más sencillas que otras, otras más
económicas y otras más representativas.
VARIABLE
Se define como variable a la característica, cualidad o atributo de interés de las unidades de
una población o una muestra.
Las variables cualitativas son aquellas que describen las cualidades o características de
un objeto o evento mediante palabras, frases, letras, etc. Son subjetivas de acuerdo con
el observador.
Las variables cualitativas se clasifican en:
o Variables Nominales son las más simples y abundantes, su única función es la de
clasificar en categorías y su orden es indistinto. NO tiene sentido realizar
operaciones aritméticas con ellas.
o Variables Ordinales clasifican las observaciones en categorías que exigen
ordenación, su variable operacional es una escala ordinal de mayor a menor.
Las variables cuantitativas son aquellas que se pueden representar por una cantidad
numérica exacta, por lo general son medidas objetivas, es decir, que no depende de
quien realice la medición. En ocasiones puede tener un pequeño error dependiendo del
instrumento con que se mida.
o Variables Discretas son las que toman solo algunos valores dentro de un intervalo,
por ejemplo, valores enteros. Al indicar el número de hijos que tiene una familia,
el número de recámaras de una casa, el número de mascotas, etc.
o Variables Continuas Son las que pueden tomar cualquier valor fijo dentro de un
intervalo, siempre entre dos valores observables, va a existir un tercer valor
intermedio, que también podría tomar la variable continua.
De Intervalo: Esta escala, además de clasificar y ordenar, establece la
proporción o la distancia entre dos intervalos contiguos. Requiere una
unidad de medida y un punto cero arbitrario (no necesariamente el cero
absoluto). Un ejemplo clásico de este tipo de escala es la temperatura en
grados centígrados, Kelvin o Fahrenheit, ya que la unidad de medida y el
punto cero son arbitrarios.
De razón: Este tipo de escala clasifica, ordena, establece la proporción o
distancia entre dos intervalos contiguos y agrega el cero absoluto; además
son permisibles las operaciones aritméticas (suma, resta, multiplicación y
división) e implica las relaciones de equivalencia (mayor que, menor que,
y equivalente). Hay muchos casos aplicables a esta escala; por ejemplo,
se puede cuestionar a un grupo de personas sobre sus pesos o pesar
diferentes objetos; es posible estimar la altura de diferentes objetos,
animales o personas.
FRECUENCIAS
En estadística, la frecuencia (o frecuencia absoluta) Es el número de veces en que dicho evento
se repite durante un experimento o muestra estadística. Comúnmente, la distribución de la
frecuencia suele visualizarse con el uso de histogramas.
Frecuencia absoluta:
Se le llama frecuencia absoluta al número de veces que se repite una variable en un
experimento. Esta se representa con fi ó ni.
Frecuencia absoluta acumulada
La frecuencia acumulada es aquella que se obtiene al sumar todas las frecuencias absolutas
inferiores o iguales al valor en cuestión.
Frecuencia relativa
Representa la cantidad de veces que se repite una observación, expresada como proporción
de la muestra, es decir, es el resultado de dividir el valor de la frecuencia absoluta por el tamaño
de la muestra estadística.
Esta se representa con fr .y se define como fr = n/N, siendo n el número de veces que se repite la
respuesta y N el tamaño de la muestra. Su valor se expresa como porcentaje.
Frecuencia relativa acumulada
En esta se tiene en cuenta la sumatoria de todas las frecuencias relativas inferiores o iguales al
valor en cuestión. Se representa con fr.
RECOLECCIÓN DE DATOS:
La recolección de datos sirve para hacer un análisis estadístico y es un proceso que incluye los
siguientes pasos:
1. Plantear el objetivo de la investigación.
2. Definir la población de interés.
3. Si la población es demasiado grande, determinar una muestra representativa de ella,
definiendo el tamaño de dicha muestra, el procedimiento de muestreo y el instrumento
de medición (encuesta, cuestionario, vía teléfono, entre otros)
4. Definir variables
5. Finalmente, determinar las técnicas correctas de análisis de datos.
ORDENACIÓN DE DATOS:
Es muy conveniente ordenar los datos, ya sea de modo descendente o ascendente, ya que así
podemos manejar y analizar más fácilmente nuestra información.
La información ya ordenada se puede resumir y organizar en una tabla de distribución de
frecuencias, que consta de dos columnas, en la primera de las cuales se coloca la variable y en
la segunda la frecuencia (f), denominada tabla de distribución de frecuencia para datos no
agrupados.
Para ordenar los datos, cuando éstos son demasiados, resulta útil emplear el método de tallo-
hoja, el cual combina dos procedimientos: uno gráfico y otro de ordenación, de acuerdo a los
siguientes pasos:
Dibujar una tabla con dos columnas, la primera columna para el tallo y la segunda para
las hojas.
Disponer todos los tallos en la primera columna en orden descendente. Cada tallo solo
se escribe una vez.
Registrar en la segunda columna todas las hojas, en orden creciente, junto al tallo
correspondiente.
Ejemplo:
En las pruebas médicas de un instituto, se toma la altura de los cuarenta alumnos de una clase.
El médico está interesado en representar gráficamente la variable y opta por el diagrama de
tallo y hoja.
Ordena las alturas en una tabla:
Los datos son tomados en centímetros, por lo que tiene tres cifras cada número. En este
caso no se requiere redondear los datos, ya que se parte del número de dígitos que se
desea. Los dos primeros dígitos serán el tallo y el último la hoja.
Una vez preparados los datos, procede a construir el diagrama. Dibuja una tabla con dos
columnas. En la primera columna coloca los tallos ordenados de menor a mayor. En este
caso los tallos serán: 14, 15, 16, 17 y 18.
Se registra en la segunda columna todas las hojas, debidamente ordenadas, junto al tallo
correspondiente:
Se percibe visualmente la distribución de las alturas.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS.
Para facilitar el manejo de los datos cuando éstos son muy abundantes, conviene resumirlos o
condensarlos en grupos, llamados clases o categorías. Se dice entonces que los datos se han
agrupado; por lo tanto, la tabla que se genera es una tabla de distribución de frecuencias para
datos agrupados. Los pasos necesarios para elaborar dicha tabla se resumen así:
a) Obtención de los datos
b) Ordenamiento de los datos
c) Cálculo del rango
d) Cálculo del número de intervalos de clase
e) Cálculo del ancho de clase
f) Calculo de los límites inferior y superior de cada clase
g) Determinación de la frecuencia de cada clase
h) Elaboración de la tabla de distribución de frecuencias.
Rango (R). Es la diferencia entre los valores máximo y mínimo de una serie de datos, se representa
con la letra R y se calcula con la siguiente formula R = V max - Vmin
Intervalos de clase (Iclase). Existe la fórmula de Herbert Surges para calcular el número de
intervalos de clase Iclase=√𝑛, Iclase= 1 + 3.3 log n, donde n es el número de elementos de la muestra
o población de estudio, (se toma solo la parte entera).
Ancho de clase (c). Se divide el Rango entre el intervalo de clases 𝑐= (Sin importar si el
resultado es entero o no, se incrementa al siguiente entero superior).
Límite Inferior (LI). Para determinar el LI de la primera clase, se analiza primero si el rango de datos
se ajusta a los intervalos y al ancho de clase calculados. Si se le suma el valor menor al ancho de
clases y al resultado se le vuelve a sumar el ancho de clase y así sucesivamente hasta completar
los intervalos, éstos se pueden graficar. Aritméticamente se calcula multiplicando el acho de
clase por el intervalo de clase y restando el rango al resultado.
Rclase = Ic Rclase – R
(el excedente se reparte entre ambos extremos en dos partes enteras, que serán iguales si el
exceso es número par o si es impar éste se descompone en dos números enteros próximos, el
valor más pequeño se le resta al valor menor de todos los datos y el resultado será LI de la primera
clase.
El límite inferior del segundo intervalo de clase corresponde al siguiente valor entero del límite
superior de la clase anterior.
Determinación de la frecuencia por clase (f i). Se cuentan los valores que corresponden al
intervalo de cada clase, éste representa la frecuencia de clase.
Elaboración de la tabla de distribución de frecuencias. Se organizan los datos en dos columnas,
en la primera se escriben los intervalos de clase y en la segunda las frecuencias de clase.
Marca de clase
Es necesario conocer un valor representativo de cada intervalo de clase, ya que cada uno de
éstos contiene una serie de datos muy amplia. Este valor se calcula obteniendo el promedio de
los límites de cada intervalo, conocido como marca de clase y representado con la letra X. Para
encontrar la marca de clase se pueden utilizar las siguientes formulas:
( ) ( )
𝑋= 𝑋=
Representación gráfica de los datos estadísticos
Es conveniente representar los datos de una tabla de distribución de frecuencias en forma
gráfica, ya que resulta más atractiva y fácil de visualizar. Las gráficas más empleadas son los
histogramas, los polígonos de frecuencias, las ojivas y las de tallo-hoja.
Las gráficas también son útiles para calcular medidas estadísticas como, por ejemplo:
o Histogramas
o Polígonos de frecuencias
o Gráfica circular
o Ojivas
o Diagrama de barras