República Bolivariana De Venezuela
Ministerio Del Poder Popular Para La Educación Superior
Universidad Nacional Experimental De Los Llanos Occidentales
“Ezequiel Zamora”
Extensión Esteller
Módulo III
ESTADISTICA
Participantes:
Dainys Carpio C.I 18843802
Neirysbel Alvarado C.I 21057738
Prof: Luis Duran
Sub-Proyecto: Estadística
Turno: Nocturno
DEFINICION DE NUMEROS INDICES Y SU USO
Son medidas estadísticas que sirven para comparar magnitudes de una o más variables en un período (o lugar)
dado, con la magnitud de esa misma o mismas variables en otro período (o lugar) de referencia llamado base.
Los números índices pueden tener distinta naturaleza: A) NATURALEZA ESTADISTICA, cuando se obtienen sin
tener en cuenta las posibles relaciones funcionales de las magnitudes en estudio, y B) NATURALEZA
FUNCIONAL, cuando se obtienen suponiendo una relación funcional entre los valores de las variables y su
entorno.
Mediante los números índices se pretende estudiar las variaciones de un fenómeno complejo por medio de
una expresión que permita comparar dos o más situaciones distintas en el tiempo y/ó el espacio.
Según el número de variables con las que se trabaja en la construcción de un número índice, se los puede
agrupar en dos grandes capítulos: * Números Índices Simples: se construyen para medir los cambios o
variaciones (a través del tiempo o del espacio) de una sola variable. *Números Índices Compuestos: miden los
cambios conjuntos de dos o más variables. Tomando en cuenta la metodología utilizada para su construcción y
cálculo, los índices compuestos se diferencian en índices de agregados y del promedio de relativos, pudiendo a
su vez clasificarse cada uno de ellos en no ponderados y ponderados.
Construcción de índices simples y AGREGADOS
Los Números Índices Simples y agregados
Estos índices tienen la finalidad de medir los cambios o variaciones de los datos x1, x2, x3, ... xi,... xt de una
única variable X. Estos valores pueden resultar de observaciones realizadas a una única unidad de análisis a
través de diferentes momentos de tiempo (datos longitudinales).
Por lo tanto, los valores de una variable genérica X, observados en “t” períodos consecutivos de tiempo
(quinquenios, años, meses, semanas, días, etc.), se simbolizarán del siguiente modo:
Si la variable en estudio fuera el precio de un
producto o servicio registrado en diferentes
períodos, el símbolo genérico a utilizar será
“pi” (en lugar de xi) que denota: el precio del
artículo en cuestión, registrado en el i-ésimo período de la serie. Valor de X correspondiente al i-ésimo período
Según el tipo de interrogante que nos planteemos sobre el comportamiento de la variable que estamos
analizando, se pueden realizar diversas operaciones que dan lugar a diferentes números índices.
Los Índices de Agregados Ponderados
Al construir un índice de precios (o de cantidades) podemos tomar la decisión de ponderar por las cantidades
(o precios) del año base, del año que se está analizando o por un valor que promedia ambas magnitudes. Según
sea la ponderación que adjudiquemos a cada variable al construir el índice, vamos a estar en presencia de un
tipo particular de índice de agregados ponderados.
El Índice de Laspeyres: Para la construcción de este índice se utilizan como ponderaciones magnitudes
(cantidades o precios) del año base. Si se trata de un índice de precios (IPL ), este se obtendrá haciendo:
La aplicación de la fórmula de Laspeyres para
un período “j” dado (tomando como base otro
período “o” predeterminado), supone realizar
los siguientes pasos:
a. multiplicar el precio de cada artículo en el
período “j” dado por la cantidad de ese mismo artículo registrada en el período base,
b. realizar la suma de los productos así calculados, a través de los n artículos que intervienen en el índice,
c. multiplicar el precio de cada artículo en el año base por la correspondiente cantidad en el mismo período
base y sumar estos productos a lo largo de todos los artículos,
d. dividir la suma realizada en b por la suma realizada en c y, luego, al resultado multiplicar por cien.
Es obvio que para el cálculo de este índice se necesita más información (datos) que para el cálculo de los
índices no ponderados que hemos visto. En efecto, el índice de precios de Laspeyres requiere de datos de
cantidades (compradas, vendidas, producidas, etc.) de cada uno de los artículos que lo integran para, al menos,
el período seleccionado como base.
Índice de Agregado no Ponderado
Con este índice se miden las variaciones producidas en magnitudes que surgen de agregar cantidades simples
(ej.: precios de los cereales, cantidades exportadas de productos agrícolas, etc.).
Al índice de agregado no ponderado se lo define como la suma de las magnitudes de todas las variables
consideradas, para un mismo período dado “j” de la serie; dividida por la suma de todas las magnitudes
correspondientes a esas mismas variables en el período elegido como base. El valor del índice expresado en
porcentaje se obtiene haciendo:
Si las variables en estudio fueran los precios de una
canasta de n artículos diferentes, el índice de agregado no
ponderado (para cierto período “j” con base en otro
período “o” de la misma serie) resultará:
En el cálculo de este índice se considera una unidad de cada bien, y expresa el precio
total (de ventas, compras, etc.) de los “n” artículos en cada período, como un
porcentaje del precio de esos mismos artículos en el período base.
Cambio de base.
Un problema que se plantea con frecuencia en largas series de números índices es la pérdida de
representatividad de éstos al alejarnos del periodo base, y más aún cuando las magnitudes del período
corriente se ponderan con valores del periodo base (por ejemplo, en el índice de Laspeyres). Este problema se
puede resolver haciendo un cambio de base a un periodo más cercano en el tiempo, es decir, renovando el
índice.
Cuando se renueva un índice es deseable disponer de los valores del índice en los periodos anteriores al de la
nueva base, esto es, echar hacia atrás el nuevo índice, lo que se conoce como enlace o empalme de la serie. El
valor que permite pasar la serie en la base antigua a la nueva base se denomina coeficiente de enlace.
Igualmente, aunque tiene menor interés, se podría prolongar la serie en la base antigua utilizando los mismos
procedimientos que permiten echar la serie nueva hacia atrás
Un problema que se plantea con frecuencia en largas series de números índices es la pérdida de
representatividad de éstos al alejarnos del periodo base, y más aún cuando las magnitudes del período
corriente se ponderan con valores del periodo base (por ejemplo, en el índice de Laspeyres). Este problema se
puede resolver haciendo un cambio de base a un periodo más cercano en el tiempo, es decir, renovando el
índice.
Cuando se renueva un índice es deseable disponer de los valores del índice en los periodos anteriores al de la
nueva base, esto es, echar hacia atrás el nuevo índice, lo que se conoce como enlace o empalme de la serie. El
valor que permite pasar la serie en la base antigua a la nueva base se denomina coeficiente de enlace.
Igualmente, aunque tiene menor interés, se podría prolongar la serie en la base antigua utilizando los mismos
procedimientos que permiten echar la serie nueva hacia atrás.
APLICACION
2. Aplicar la propiedad circular. Así, si tenemos el índice en base 0 y se realiza un cambio de base en t para
obtener el valor del nuevo índice en un periodo t', anterior a t, operaríamos del siguiente modo:
Ahora bien, los índices de Laspeyres y Paasche no cumplen esta
propiedad; por ejemplo, para el índice de Laspeyres,
Por este motivo, en estos casos los valores obtenidos del nuevo índice en los
periodos anteriores al nuevo periodo base serían aproximaciones.
Por tanto, la primera opción, que proporciona valores exactos, sería más
adecuada que la segunda, que proporciona sólo valores aproximados; sin embargo,
habitualmente habrá que aplicar la propiedad circular (esto es, una simple "regla de tres") dado que
se desconocerán los precios o las cantidades para el período t' de los bienes incluidos en la nueva base.
Regresión y correlación concepto
Regresión: Consiste en la búsqueda de una “función” que exprese lo mejor posible el tipo de relación entre dos
o más variables.
Correlación: Estudia el grado de dependencia entre las variables, es decir su objetivo es medir el grado de
ajuste existente entre la función teórica (función ajustada) y la nube de puntos. Por lo tanto, una variable
independiente que presente un alto grado de correlación con una variable dependiente será muy útil para
predecir los valores de ésta última. Cuando la relación entre las variables es lineal, se habla de correlación
lineal.
diagrama de dispersión
En estadística, los diagramas de dispersión son unos gráficos en el que los puntos de datos se trazan en dos
ejes, generalmente el eje x y el eje y, para mostrar cuánto afecta una variable a otra. Los puntos de datos
generalmente se representan como puntos en el gráfico. Una correlación es una medida estadística de la
relación entre dos variables. Las correlaciones pueden ser positivas o negativas, lo que significa que a medida
que aumenta una variable, la otra aumenta o disminuye.
ANÁLISIS DE CORRELACIÓN
Esta técnica estadística sirve para entender si existe una relación entre dos o más variables, ayudando a
determinar si una variable se mueve en función de la otra. Si hay algún tipo de correlación, ambas variables se
alterarán juntas durante un periodo de tiempo.
Análisis de correlación positiva: Se presenta cuando el aumento de cualquiera de las dos variables,
hace que la otra también crezca. Esto implica que existe una correlación positiva entre ellas.
Análisis de correlación negativa: Aparece cuando el aumento de cualquiera de las variables causa que
la otra disminuya. Esto supone que hay una correlación negativa entre ellas.
Es importante distinguir entre análisis de regresión y correlación. Mientras que la correlación determina qué
tan relacionadas están dos variables, la regresión genera un modelo que, apoyándose en esa relación, permite
predecir el valor de una variable a partir de la otra.
COEFICIENTE DE CORRELACIÓN.
La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una medida de
regresión que pretende cuantificar el grado de variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos variables, es decir, si se
representan en un diagrama de dispersión los valores que toman dos variables, el coeficiente de correlación
lineal señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado de intensidad y el
sentido de la relación entre dos variables.
Cov (x;y): la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
COEFICIENTE DE DETERMINACIÓN.
El coeficiente de determinación es la proporción de la varianza total de una variable explicada por una
regresión. También conocido como R cuadrado, indica qué tan bien un modelo se ajusta a la variable que
pretende explicar.
El resultado del coeficiente de determinación varía entre 0 y 1. Cuanto más cerca esté de 1, mejor se ajusta el
modelo a la variable. Si está cerca de 0, el modelo es menos ajustado y menos fiable.
Regresión lineal simple
La regresión lineal simple consiste en generar un modelo de regresión (ecuación de
una recta) que permita explicar la relación lineal que existe entre dos variables. A la variable dependiente o
respuesta se le identifica como Y y a la variable predictora o independiente como X .
El modelo de regresión lineal simple se describe de acuerdo a la ecuación: Y=β0+β1X1+ϵ
Siendo β0 la ordenada en el origen, β1 la pendiente y ϵ el error aleatorio.
Este último representa la diferencia entre el valor ajustado por la recta y el valor real. Recoge el efecto de
todas aquellas variables que influyen en Y pero que no se incluyen en el modelo como predictores. Al error
aleatorio también se le conoce como residuo.
En la gran mayoría de casos, los valores β0 y β1 poblacionales son desconocidos, por lo que, a partir de una
muestra, se obtienen sus estimaciones β^0.
Estas estimaciones se conocen como coeficientes de regresión o least square coefficient estimates, ya que
toman aquellos valores que minimizan la suma de cuadrados residuales, dando lugar a la recta que pasa más
cerca de todos los puntos. (Existen alternativas al método de mínimos cuadrados para obtener las
estimaciones de los coeficientes).
[Link]
[Link]