0% encontró este documento útil (0 votos)
29 vistas11 páginas

Análisis Unidimensional de Variables Estadísticas

Cargado por

Olivia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
29 vistas11 páginas

Análisis Unidimensional de Variables Estadísticas

Cargado por

Olivia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

1.

Concepto de variable estadística y tipos


Una variable es cada una de las características o cualidades que poseen los
individuos de una población. Ejemplos: renta, nivel de consumo, edad….
TIPOS:
A. VARIABLES CUANTITATIVAS →expresadas mediante números [valores]
 Discretas: Cualquier variable que puede tomar un número finito de
valores. Entre dos valores consecutivos la variable no puede tomar
ningún número entero. Ej: nº de empleados en el sector, número de
productos defectuosos fabricados…
 Continuas: Cualquier variable que puede tomar un número infinito de
valores entre dos valores cualesquiera. Suelen aparecer en intervalos.
Ej: Ingreso per cápita, temperatura, altura, potencia…
DIFERENCIA (EJEMPLO EXAMEN): Cuantitativa continua (5,96) y Cuantitativa
discreta (6)

B. VARIABLES CUALITATIVAS → se describe mediante palabras


[modalidades]
 Escala ordinal: posible establecer alguna jerarquía entre sus
modalidades. (Atributo: calificación de examen. / Modalidad:
suspenso, aprobado, notable y sobresaliente.)
 Escala nominal: No es posible establecer una jerarquía entre sus
modalidades. (Atributo: Sexo. / Modalidad: Hombre y Mujer.)

EJERCICIO: Indicar la naturaleza de las siguientes variables:


a) Forma de pago al realizar una compra.
b) Personas que asisten un día cualquiera a una discoteca.
c) Número de reclamaciones.
d) Poder de negociación de los clientes
e) Medalla de plata ganada en una competición.
f) Peso de un grupo de 50 personas.
g) Tiempo de entrega de un pedido.

RESOLUCIÓN EJERCICIO: Indicar la naturaleza de las siguientes variables:


a) Forma de pago al realizar una compra → Cualitativa Nominal. (Al contado
o a crédito)
b) Personas que asisten un día cualquiera a una discoteca → Cuantitativa
discreta.
c) Número de reclamaciones → Cuantitativa discreta.
d) Poder de negociación de los clientes → Cualitativa ordinal. (Alto, medio o
bajo)
e) Medalla de plata ganada en una competición → Cualitativa Ordinal.
f) Peso de un grupo de 50 personas → Cuantitativa continua.
g) Tiempo de entrega de un pedido. Cuantitativa Continua (horas). (discreta:
semanas o días)

3. Distribuciones de frecuencias y tipos


El estudio de una variable estadística comienza por medir la variable en los
individuos de la muestra y clasificar los valores obtenidos.
Distribución de frecuencias es el conjunto de valores que ha tomado una
variable con sus frecuencias correspondientes. La distribución de
frecuencias permite resumir los datos que previamente se han recogido de
las variables. Se muestra en la tabla de frecuencias que es una herramienta
que permite ordenar los datos de manera que se representan de forma
numérica las características de las distribuciones de un conjunto de datos o
muestra.

TIPOS DE FRECUENCIAS:

 Frecuencia total (N) → Suma de todas las frecuencias de los valores que toma la variable
 Frecuencia absoluta (ni) → Número de veces que se repite cada valor o dato de la variable
 Frecuencia absoluta acumulada (Ni) → Número de datos que hay igual al considerado o
inferiores a él.
 Frecuencia relativa (fi) → Frecuencia absoluta dividido por el número total de datos
 Frecuencia relativa acumulada (Fi) → Resultado de dividir cada frecuencia acumulada
por el número total de datos.

TIEMPO ni (frecuencia fi Ni Fi
absoluta) (frecuencia (frecuencia (Frecuencia
relativa) absoluta relativa
acumulada) acumulada)
1 30 (ni1) 30/100 = 30 0,30
0,3
2 60 (n2) 60/100 = 90 0,90
0,6
3 10 (n3) 10/100 = 100 1
0,1

100 100%
(n1+n2+n3)
 La suma de todas las frecuencias absolutas es igual a la frecuencia total

 La suma de todas las frecuencias relativas es igual 1

TIPOS DE DISTRIBUCIONES DE FRECUENCIAS


1) Datos no agrupados [variables cualitativas o cuantitativas discretas con
pocos valores diferentes] → La información se dispone asociando a cada
valor su frecuencia. Si todas las frecuencias son 1 se denomina
distribución de frecuencias unitarias.

2) Datos agrupados en intervalos [variables cuantitativas continuas y


variables discretas cuando toma muchos valores] → Si el número de los
distintos valores que ha tomado la variable es suficientemente grande es
aconsejable agruparlos en clases o intervalos. Al agrupar en intervalos
conviene tener en cuenta:
 Son útiles para presentar la información de forma comprensible.
 Perdemos información, ya que no conocemos con precisión lo que
ocurre en cada punto interior del intervalo.
 No existen reglas para determinar nº de intervalos. Los determinará
el investigador.
 Se recomienda utilizar intervalos no vacíos y equilibrados (que todos
sean iguales)
 Si los valores que toma la variable están repartidos de manera
homogénea, todos los intervalos tendrán la misma amplitud. En caso
contrario tomarán intervalos de amplitud variable.
¡¡EJEMPLOS AULA VIRTUAL DIAPOSITIVAS MUY IMPORTANTES!!

5. Tipos de gráficos
A) DATOS SIN AGRUPAR
 DIAGRAMA DE BARRAS

Es el diagrama principal para representar datos de variables discretas sin agrupar y para datos
cualitativos. [EJEMPLO DIAPOSITIVAS] Se representan:

 Eje de abscisas (x) → Los distintos valores de la variable


 Eje de ordenadas (y) → Las frecuencias absolutas ni / las
relativas fi / en porcentaje.
 DIAGRAMA ESCALONADO O ACUMULATIVO

La altura de cada escalón es la frecuencia (absoluta o relativa)


asociada al correspondiente valor de xi. Su elaboración es muy
parecida al diagrama de barras, pero en el eje de ordenadas (y) se
sitúan las frecuencias acumuladas absolutas (Ni) o relativas (Fi).

B) DATOS AGRUPADOS
 HISTOGRAMA

Se construye levantando sobre cada intervalo un rectángulo de área


proporcional a la frecuencia absoluta correspondiente a dicho
intervalo. Los intervalos pueden ser:

oAmplitud constante: Altura rectángulos = frecuencias


absolutas.
o Intervalos son desiguales: Altura rectángulos = cociente entre
la frecuencia absoluta por la amplitud del intervalo.
 POLÍGONO DE FRECUENCIAS

Es un gráfico que se obtiene a partir de un histograma, uniendo los puntos


medios de las bases superiores de los rectángulos. Se trabaja con las
marcas de clases. Permite ver las variaciones de la frecuencia de una
clase a otra. Son muy útiles cuando se pretende comparar dos o más
distribuciones, ya que, así como es difícil representar dos o más histogramas
en un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos
de frecuencias.

C) DATOS AGRUPADOS Y SIN AGRUPAR


A cada sección, cuya área es proporcional
 DIAGRAMA DE SECTORES (o de quesitos) a su frecuencia, le corresponde el ángulo:

Se dibuja un círculo que se divide en tantas porciones o


sectores como categorías o valores distintos presenta la
variable objeto de estudio. Es de máximo 5 categorías
(los hay de más, pero tienen que ser pocas). Se
utiliza con datos cuantitativos y cualitativos.

6. Estadísticos muestrales
La tabla de frecuencias sintetiza la información de la variable estudiada en
la muestra, pero en muchas ocasiones es insuficiente para describir
determinados aspectos de la distribución. Para describir adecuadamente el
comportamiento de la variable se calculan unas medidas llamadas
estadísticos que son indicadores de distintos aspectos de la distribución
muestral.
Son muestrales porque se toma a partir de una muestra. Los otros de antes
serían los poblacionales. Puede haber casos donde un muestral sea un
poblacional, cuando la muestra sea igual a la población. Se trata de dar
información de la muestra, pero sintetizado.

a) Estadísticos muestrales de posición


Miden en torno a qué valores se agrupan los datos y cómo se reparten en la
distribución. Un solo valor, una posición que representa a la muestra. TIPOS:

1. Estadísticos de Tendencia Central

Determinan valores alrededor de los cuales se agrupa la distribución.

 MEDIA
o ARITMÉTICA →

Es la suma de los valores observados en la muestra (xi) dividida por el tamaño


muestral(n). Se utiliza como medida de representatividad para la muestra. Es
única, siempre es calculable y es el centro de gravedad de la distribución.

- No puede calcularse para atributos


- Es igual para agrupados y para no agrupados
- Se ve muy afectado por las observaciones extremas
- Si existen este tipo de observaciones en la distribución puede ser una medida
escasamente representativa.
- Media aritmética ponderada: A cada valor de la variable se le otorga una ponderación
o peso (distinto de la frecuencia) que se tendría en cuenta para el cálculo de la media
PROPIEDADES MEDIA ARITMÉTICA

1) La suma de las desviaciones de todas las puntuaciones de una distribución


respecto a la media de la misma igual a cero. Propiedades de la media aritmética
2) La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a
un número cualquiera se hace mínima cuando dicho número coincide con la media
aritmética.
3) Queda afectada por los cambios de origen. Si a todos los valores de la variable se
les suma o resta un mismo número, la media se aumenta o disminuye en dicho
número.
4) Queda afectada por los cambios de escala. Si todos los valores de la variable se
multiplican o dividen por un número, la media se multiplica o divide por número.

o GEOMÉTRICA →

Es la raíz N-ésima del producto de los valores de la variable. En lugar de


multiplicar por la frecuencia, elevamos a la frecuencia. Para
porcentajes, tasas, números índices, variaciones acumulativas, datos
acumulados…

El logaritmo de la media geométrica es igual a la media aritmética de los


logaritmos de los valores de la variable.
o ARMÓNICA →

La inversa de la media armónica es la media aritmética de los inversos de los valores de la


variable. Se recogen los datos de forma inversa.
Considera todos los valores de la distribución y, en ciertos casos,
es más representativa que la aritmética. Carece de sentido si
algún valor es 0. Se utiliza para velocidades, tiempos… [Cuando la magnitud tiene un
cociente ej: km no, pero km por hora sí / hojas por hora…]. En general para
promediar todo aquello cuyas unidades vengan expresadas como el cociente de dos
magnitudes simples.

→ RELACIÓN ENTRE LAS TRES MEDIAS


(¡¡¡PREGUNTA EXAMEN!!!)

EJ: Nos pregunta a todos la estatura, para saber la estatura media calculo la
aritmética. No tiene sentido calcular la geométrica o la armónica ya que es
solo un dato suelto.

 MEDIANA

Aquel valor de la distribución (ordenada de menor a mayor) que ocupa el lugar central [deja a
la izq. y drcha. el mismo nº de frecuencias]. Tiene mucha utilidad cuando los datos
son muy extremos, por ejemplo, con la renta o la población. Cuando es par
se hace una media aritmética entre los dos valores centrales.

 Mediana con datos agrupados

1) Calculamos las frecuencias acumuladas (Ni).


2) Calculamos N/2 → es la frecuencia que nos va a proporcionar la mediana,

3) Buscamos el primer intervalo tal que 𝑁/2 ≤ 𝑁𝑖, que será el intervalo mediano (𝑳𝒊−𝟏,
valor que voy a utilizar para calcular la mediana

𝑳𝒊)

 L i-1: límite inferior del intervalo (donde esta


N/2)
 Ni-1: frecuencia acumulada del intervalo
anterior
 C1: amplitud del intervalo
LA TABLA QUE HABRÍA QUE HACER:

Li-1, Li xi Ni ni C1
N → N/2 = Me

EJEMPLO DIAPOSITIVA 52: La interpretación del resultado es que → el


salario que recibe el 50% de la población más desfavorecida ganarían 913
euros. La mitad de los obreros que menos ganan, ganan hasta 913, después
hay otra mitad de los obreros que ganan más. Si fuese equitativa la
empresa, la media y la mediana deben ser parecidas. Es importante tener
en cuenta la amplitud, por eso añadimos la columna C1.

 MODA

Es el valor de la variable que más se repite un mayor número de veces. Hay 3 opciones:

 Sin moda (una distribución unimodal o repeticional, por Ej, en el dado


[La Ni6=6])
 La moda sea única (hay una Ni mayor)
 La moda no es única (hay una Ni mayor, pero se repite ese número,
entonces hay varias modas, es una distribución bimodal.)

MODA CON DATOS AGRUPADOS

 Intervalos de igual amplitud


 Li-1: límite inferior
 Ni+1: frecuencia del intervalo modal siguiente
 Ni-1: frecuencia del intervalo modal anterior
 C1: amplitud intervalo modal

 Intervalos de distinta amplitud

 Li-1: límite inferior


 di+1: densidad del intervalo
siguiente
 di-1: densidad del intervalo anterior
 di: densidad de frecuencia [es la concentración que hay en un
intervalo]

Cuando tenemos intervalos de distinta amplitud, tenemos que calcular obligatoriamente la


densidad de frecuencias.

1. Otros estadísticos de Posición

Dividen la distribución en partes con el mismo número de observaciones.

 CUANTILES

Son valores de la variable que dividen la distribución, ordenada de menor a mayor


[importante], en partes que contienen el mismo número de datos (divide en partes iguales).
Más utilizados:
a) Cuartiles → 3 valores que dividen la distribución en 4 partes iguales. En
cada parte está el 25% de los valores de la distribución. [El cuartil 2 es la
mediana: divide la distribución en 2 partes iguales].
b) Deciles → 9 puntos que dividen la distribución en 10 partes. En cada
parte está el 10% de los valores de la distribución.
c) Percentiles → 99 puntos que dividen la distribución en 100 partes. En
cada parte está el 1% de los valores de la distribución.

La determinación del k-ésimo cuantil de orden r, se realiza utilizando los mismos criterios que
en la mediana, con la diferencia de que el cociente de referencia viene dado por:

b) Estadísticos de dispersión
Miden la heterogeneidad de la variable y la concentración de sus valores en torno a algún valor
central. A la mayor o menor separación de los valores se le llama dispersión o variabilidad.
Cuanto más agrupados estén los valores alrededor de la media, más representativa será, y
menos cuanto más dispersos estén. [EJEMPLO DIAPOSITIVA 59]
Para las variables cuantitativas, los estadísticos de dispersión más utilizados son:
 RECORRIDO
Diferencia mayor y menor valor de una distribución.

 RANGO INTERCUARTÍLICO
Diferencia entre tercer y primer cuantil. Amplitud del intervalo en el que se encuentra
el 50% de los valores centrales. A partir del 3 es el 25% que mas tiene.

 VARIANZA
La varianza de una variable X se define como la media aritmética de los
cuadrados de las desviaciones de los valores de la variable respecto a su media
muestral.
¡¡PROPIEDADES CAEN EXAMEN TEST!!
1- La varianza viene medida en las unidades de la variable al cuadrado, lo cual dificulta su
interpretación. No se puede decir, por ejemplo: habitaciones al cuadrado.
2- No permite establecer comparaciones entre distintas magnitudes.
3- La varianza no pude ser nunca negativa →
4- La varianza NO se ve afectada por los cambios de origen [sumar o restar números]
5- La varianza SÍ se ve afectada por cambios de escala [multiplicar (ej: todos los valores se
incrementan un 30%) o dividir/disminuir].

 DESVIACIÓN TÍPICA
La desviación típica de una variable X se define como la raíz cuadrada positiva de la
varianza muestral. Es decir, calculamos primero la varianza y luego hacemos la raíz del
resultado.
La varianza tiene las unidades de la variable al cuadrado, por lo que para facilitar su
interpretación se suele utilizar su raíz cuadrada. Tanto la varianza como la desviación típica
sirven para cuantificar la dispersión de los datos en torno a la media. Si la dispersión es grande
la media será menos representativa que si la dispersión es pequeña. PROPIEDADES:
1) La desviación típica viene medida en las mismas unidades de la variable
2) La desviación típica no pude ser nunca negativa
3) La desviación típica NO se ve afectada por los cambios de origen
4) La desviación típica SÍ queda afectada por los cambios de escala.

 COEFICIENTE DE VARIACIÓN
El coeficiente de variación muestral de una variable X se define como el cociente entre su
desviación típica muestral y el valor absoluto de su media muestral. Mide la dispersión
relativa de los valores de la muestra en torno a la media muestral.A mayor valor del La media en valor absoluto

coeficiente de variación mayor será la dispersión respecto a la media.


Tanto la varianza como la desviación típica tienen
unidades y eso dificulta a veces su interpretación y su
comparación. Pero es fácil definir a partir de ellas una
medida de dispersión adimensional + fácil de
interpretar.

1) Representa el número de veces que la desviación típica es mayor que la media aritmética.
2) Puede tomar cualquier valor.
3) Como no tiene unidades, es adimensional, resulta muy sencillo de interpretar: Cuanto
mayor sea, mayor será la dispersión. También se utiliza para comparar la dispersión entre
muestras distintas incluso si las variables tienen unidades diferentes
4) Si la media es cero, el coeficiente de variación no es una buena medida.

La media SÍ que puede tomar valores negativos. Puede tomar tanto positivos como negativo. La
varianza NO puede ser negativa→ ¡¡PREGUNTA EXAMEN!!

c) Estadísticos de forma
Son medidas que tratan de caracterizar aspectos de la forma de la distribución de una muestra.
Miden aspectos de la representación gráfica de los datos, como la simetría o el apuntamiento.
o Coeficiente de Asimetría de Fisher

Miden la simetría de la distribución en torno a la


media. Permite determinar en qué medida las
observaciones se disponen simétricamente en torno a
un determinado punto, que generalmente es la media
aritmética.
Asimétrica a izquierdas (pesan los datos más pequeños de la media, los de la izquierda) y la
Asimétrica a derechas (pesan los datos más grandes de la media, los de la derecha)
El coeficiente de asimetría muestral de una variable X se define como el promedio de la suma
de las desviaciones de los valores de la muestra a la media muestral, elevadas al cubo, dividido
por la desviación típica al cubo. Es una medida adimensional.
El signo de g1 depende del numerador porque → S^3: desviación típica al cubo
o Coeficiente de
Apuntamiento o Curtosis
Comparamos la distribución con una distribución Normal de media y
varianza igual que la distribución que analizamos.
El coeficiente de apuntamiento muestral de una variable X se define como el promedio de la
suma de las desviaciones de los valores de la muestra a la media muestral, elevadas a la cuarta,
dividido por la desviación típica a la cuarta y al resultado le resta 3. Es una medida
adimensional.

S^4: desviación típica a la


4

También podría gustarte