Resúmen EyP
Resúmen EyP
Incluye las técnicas que se relacionan con el resumen Hay dos tipos, las variables discretas , que solo
y la descripción de datos numéricos. Estos métodos pueden tener valores observados en puntos
pueden ser gráficos, diagramas, indicadores como aislados a lo largo de una escala y sus valores se
promedios, porcentajes o índices. Es un método expresan en números enteros .
“exacto”.
Las variables continuas , pueden suponer un valor
en cualquier punto fraccionario de un intervalo
INFERENCIA ESTADISTICA
específico.
Comprende aquellas técnicas por medio de las cuales
se toman decisiones sobre una población estadística Con ambas se pueden realizar operaciones
basadas en una muestra o en juicios de los algebraicas.
administradores. Se toman decisiones en un contexto
de incertidumbre, por lo que no es un método exacto. ESCALAS DE MEDICION
DATOS CATEGORICOS
POBLACION
En una escala nominal, no hay un orden jerárquico,
Conjunto de todos los elementos que estamos como es el caso del género.
estudiando, acerca de los cuales intentamos sacar
En una escala ordinal, si existe un orden jerárquico,
conclusiones. Las medidas de una población se
como es el caso del grado de instrucción.
denominan parámetros y se miden en censos.
DATOS NUMERICOS
MUESTRA En una escala de intervalo, existe orden y una medida
Parte de una población que se considera de distancia entre dos observaciones cualquiera. El
representativa de la misma para obtener resultados cero de la escala es convencional y los cocientes no
válidos. Las medidas se llaman estadísticas muestrales tienen significado.
y se miden con una encuesta.
En una escala de razón, existe orden y una medida de
M. Homogénea: Individuos que provienen de la distancia entre dos observaciones cualquiera, pero
misma población. hay un punto de partida, que es el cero, y los
cocientes si tienen significado.
M. Independencia: Observaciones no condicionadas.
M. Representativa: Selección que refleje a la
población de origen.
1
ESTADÍSTICA Y PROBABILIDAD
MUESTREO ALEATORIO UNIDAD 2: ORGANIZACIÓN Y PRESENTACIÓN DE
DATOS
Es aquel en el que cada uno de los elementos de la
población de interés, tiene una probabilidad conocida DIAGRAMA DE TALLOS Y HOJAS
y frecuentemente igual, de ser elegido. Se calcula un
error estándar, insesgado matemáticamente y es más Este diagrama es una de las formas más sencillas para
organizar datos. Nos permite observar la distribución
utilizado en investigaciones cuantitativas.
de los datos.
Aleatorio simple: Existe la misma probabilidad de Consiste en separar los datos en “dígitos guía” o
selección y se necesitan los elementos de la población “tallos” y en “dígitos rastreros” u “hojas”.
y numerarlos. Se pueden observar aspectos relacionados con la
dispersión o el sesgo de los datos. También se pueden
Sistemático: Muestra por unidades regulares de observar la presencia de datos extremos, que pueden
tiempo, orden o espacio y se necesitan los elementos afectar a algunos de los parámetros/estadísticos.
de la población. Pasos para construirlo:
1 Ordenar los valores de manera ascendente.
Estratificado: Demanda un conocimiento previo de la
2 Definir los “tallos” y “hojas”.
población; se divide en estratos con caract. similares 3 Construir el diagrama: se puede agrupar en
entre sí, pero cada estrato tiene caract. diferentes; se menos o más tallos.
usa para poblaciones heterogéneas.
DISTRIBUCION DE FRECUENCIAS
Conglomerados: Se eligen de manera aleatoria con
Es una tabla en la cual se agrupan en clases los
algún criterio común y se construye una muestra con valores posibles para una variable y se registra un
ellos; para poblaciones en las que no se tiene un número de valores observados que corresponde a
listado actualizado. cada clase. Los datos organizados se denominan
datos agrupados.
MUESTREO NO ALEATORIO Pasos para construirlo:
La selección la realiza el investigador, por lo que existe 1 Definir las categorías o agrupamientos (clases). El
un sesgo matemático. No se estima un error asociado número de clases depende de las necesidades de
y es más utilizado en investigaciones cualitativas. cada analista.
2 Definir el ancho de clase (amplitud del intervalo):
3
ESTADÍSTICA Y PROBABILIDAD
UNIDAD 3: MEDIDAS DE POSICIÓN Y DE suman estos productos (∑) para después dividir esta
VARIABILIDAD suma entre el número total de observaciones (∑f)
representadas en la distribución de frecuencias.
MEDIDAS DE POSICION
MEDIANA
Es un valor que se calcula para un grupo de datos y
que se utiliza para describirlos de alguna manera. Es el valor del dato que ocupa un lugar central cuando
Normalmente se desea que el valor sea se los agrupa a todos en orden ascendente o
representativo de todos los valores incluidos en el descendente. Se supone que se encuentra en la mitad
entre los dos valores adyacentes al centro.
grupo.
MEDIA FÓRMULA
Med =X
MEDIA ARITMETICA [ ( n2 )+( 12 )]
Se define como la división de la suma de todos los MEDIANA PARA DATOS AGUPADOS
valores entre el número de valores.
Primero se debe determinar la clase que contiene el
valor de la mediana.
FÓRMULA
Población: μ=
∑X Muestra: X=
∑X FÓRMULA
N n
( )
N
−fa A
MEDIA PONDERADA 2
Med =LI . .i
fc
Es una medida aritmética en la cual se considera a
cada uno de los valores de acuerdo con su MODA
importancia en el grupo.
Es el valor que se presenta con mayor frecuencia en
FÓRMULA un conjunto de datos.
Si una distribución tiene una sola moda, se la llama
μ p o X P=
∑ (pX ) unimodal. Si ningún número se repite, no tiene moda.
∑p Si hay dos valores que se repiten, es bimodal; y si hay
Cada uno de los valores del grupo (X) se multiplica por muchos, se llama multimodales.
el factor de ponderación apropiado (p) y después se MODA PARA DATOS AGRUPADOS
suman estos productos y la suma se divide entre las
ponderaciones. Primero se identifica la clase que contiene la moda
determinando cuál de ellas tiene el mayor número de
MEDIA ARITMETICA PARA DATOS
observaciones.
AGRUPADOS
FÓRMULA
Moda=LI +
( d1
d 1+ d 2
.i
)
Población: μ=
∑ (f X c ) Muestra:
d1 = diferencia entre la frecuencia de la clase modal y
la frecuencia de clase anterior.
N
X=
∑ (fX ) d2 = diferencia entre la frecuencia de la clase modal y
la frecuencia de clase siguiente.
n
Cada punto medio de clase se multiplica ( X c) por la
frecuencia de clase correspondiente (f), luego se
4
ESTADÍSTICA Y PROBABILIDAD
FÓRMULAS FÓRMULA
([ 24n )+( 12 )]
Q 2= X
EJE MEDIO
Rango medio=( X mayor −X menor ) /2
3
[ 10 2 ]
D = X ( )+ ( )
3n 1
Medida de resumen que se utiliza para superar los
posibles problemas derivados de la presencia de
P =X (
70
[ 70100n )+( 12 ) ] valores extremos en los datos.
( )
2n
−fa A RANGO
4
Q2=L I + .i
fc Es la diferencia entre los valores mayor y menor del
conjunto de datos.
( )
3n
−fa A
10
D3=L I + .i FÓRMULA
fc
Rango=My−Mn
( )
70 n
−fa A RANGO INTERCUARTIL
100
P70=L I + .i
fc
5
ESTADÍSTICA Y PROBABILIDAD
Es la diferencia entre el tercer cuartil y el primer Se asume que el punto medio de cada clase
cuartil en una distribución. Mide la dispersión del 50% representa a todas las mediciones incluidas en esa
de los datos centrales de una distribución. clase.
FÓRMULA
FÓRMULAS
Rango intercuartil=Q3−Q1
Población: σ 2=∑ ¿ ¿ ¿
DESVIACION MEDIA
Muestra: s2=
∑ [f ( X− X )2 ]
Se basa en la diferencia entre el valor absoluto de n−1
cada uno de los elementos del conjunto de datos y la
media del grupo.
DESVIACION ESTANDAR
FÓRMULA
Como es difícil interpretar el significado del valor de
DM poblacional=
∑ |X −μ| una varianza porque las unidades se expresan al
N cuadrado; se utiliza con mayor frecuencia la raíz
DM muestral=
∑ |X −X| cuadrada de la varianza, llamada desviación estándar.
n
FÓRMULAS
DESVIACION MEDIA PARA DATOS
AGRUPADOS
√
representa a todas las mediciones incluidas en cada
∑ ( X −X )
2
clase. Muestra: s2=
n−1
FÓRMULA DESVIACION ESTANDAR PARA DATOS
DM poblacional=
∑ (f |X −μ|) AGRUPADOS
N
DM muestral=
∑ ( f |X −X|) FÓRMULAS
n Población: σ 2= √∑ ¿ ¿ ¿ ¿
VARIANZA
FÓRMULAS FÓRMULAS
Población: σ 2= ∑
2
(X −μ) σ s
Población: CV = Muestra: CV =
N μ X
Muestra: s = ∑
2
(X− X) COEFICIENTE DE ASIMETRIA DE
2
PEARSON
n−1
Mide la desviación de la simetría, expresando la
VARIANZA PARA DATOS AGRUPADOS diferencia entre la media y la mediana con respecto a
la desviación estándar del grupo de mediciones.
6
ESTADÍSTICA Y PROBABILIDAD
FÓRMULAS Ejemplos
3 (μ−Med ) Fr (m-2s ; m+2s) ≥ 0,75 ; 0,75 = 1 – (1/22)
Asimetría poblacional =
σ
3 ( X−Med ) Fr (m-3s ; m+3s) ≥ 0,895 ; 0,895 = 1 - (1/32)
Asimetría muestral=
s Fr (m-4s ; m+4s) ≥ 0,94 ; 0,94 = 1 - (1/42)
Simétrica: el valor es cero (la media y la mediana
iguales).
Asimetría positiva: el valor es positivo (la media es
mayor a la mediana).
Asimetría negativa: el valor es negativo (la media es
menor que la mediana).
UNIDAD 4: PROBABILIDAD
USO DE LA DESVIACION ESTANDAR
PROBABILIDAD
Ésta, es la medida más importante, ya que se utiliza
junto con varios métodos de inferencia estadística. Es la medición de la posibilidad de que ocurra un
Como ejemplo de su uso, considérese una distribución evento particular.
de frecuencias que es al mismo tiempo simétrica y El estudio matemático de la aleatoriedad se llama
mesokúrtica. Teoría Probabilística.
El análisis estadístico a una curva de frecuencias con ENFOQUES CONCEPTUALES
estas características se la denomina curva normal.
REGLA EMPIRICA ENFOQUE CLÁSICO: La probabilidad de que ocurra un
evento se calcula como la cantidad de casos
Para una distribución que tiene una distribución favorables a dicho evento sobre el total de resultados
normal, se sabe que aproximadamente el 68% de las igualmente posibles.
mediciones se encuentra a no más de una Desviación
Estándar de la Media y que aproximadamente el 95% FÓRMULA
de las mediciones se encuentran a no más de dos
número de casos favorables
Desviaciones Estándar de la Media. P ( A )=
número de casos posibles
- Todos los resultados son igualmente posibles.
- Los resultados son mutuamente excluyentes.
- Valor de probabilidad objetivo.
ENFOQUE FRECUENCIAL: La probabilidad se basa en la
cantidad de veces que ocurre un evento en un
determinado número de observaciones o
experimentos.
TEOREMA DE CHEBYSHEV
FÓRMULA
Este teorema se utiliza cuando la distribución no tiene
número de observaciones
distribución normal. P ( A )=
tamaño de muestra
La probabilidad de que cualquier variable aleatoria X
tome un valor entro de K desviaciones estándar de la - Los resultados son mutuamente excluyentes.
media es de al menos 1-1/K2. Es decir, - Valor de probabilidad objetivo.
1 ENFOQUE SUBJETIVO: Es el “grado de confianza” que
P ( μ−Kσ < X < μ+ Kσ ) ≥ 1−
K
2 alguien tiene de que ocurra un evento, con base en
toda la evidencia que tiene disponible.
El teorema es válido siempre que K > 1.
7
ESTADÍSTICA Y PROBABILIDAD
- El valor de la probabilidad está sujeto a un juicio P (A1 U A2 U A3 U …) = P(A1) + P (A2) + P(A3) + ...
personal. 5 La probabilidad del evento imposible es igual a cero.
EXPRESION DE LA PROBABILIDAD P(Ø) = 0
6 El evento complemento de A es el evento que
P (A), significa la probabilidad de que ocurra el evento consiste en todos los resultados que no pertenecen
A en una sola observación.
al conjunto A.
El menor valor que puede tener una probabilidad es 0 Si A U A’= Ω entonces P (A U A’) = 1
(evento imposible), y el mayor valor que puede tomar P (A) + P (A’) = 1 P (A) = 1 - P (A’)
es 1 (es seguro que ocurra).
7 La probabilidad es un número que varía entre 0 y 1.
La suma de la probabilidad de ocurrencia (A) más la de 0 ≤ P(A) ≤ 1
no ocurrencia (A’) siempre es igual a 1.
P ( A ) + P ( A ' )=1
DIAGRAMA DE VENN CONCEPTOS BASICOS
Es un diagrama que permite ilustrar los eventos que ESPACIO PROBABILÍSTICO O MUESTRAL: Conjunto de
pueden ocurrir en una observación. Una figura todos los resultados posibles de un experimento
cerrada representa un espacio muestral, y se utilizan aleatorio, se simboliza con omega (Ω).
porciones del área dentro de ese espacio para
representar eventos elementales o compuestos o Cada punto del espacio muestral corresponde a un
espacios de eventos. experimento, es mutuamente excluyente de los
restantes y todos los eventos deben ser
colectivamente exhaustivos.
EVENTO O SUCESO: Se trata de cada uno de los
resultados posibles de un experimento.
Cada evento tiene asociada una probabilidad. Si
La expresión de probabilidad se representa en este combinamos eventos simples, obtenemos eventos
diagrama como la proporción, razón, cociente entre el compuestos.
número relativo de resultados favorables de A (a) EVENTO SIMPLE: Contiene exactamente un punto de
respecto al número relativo de resultados A’ (b). muestra en omega.
Ejemplo: en la tirada de un dado el espacio
FÓRMULA probabilístico sería la salida de (1, 2, 3, 4, 5, 6).
N ( A) a EVENTO COMPUESTO: Contienen más de un punto de
P ( A )= = muestra del espacio.
N (S ) a+b
AXIOMAS DE LA TEORIA DE
Ejemplo: salida de número par (del 1 al 6), incluye
tres eventos simples.
PROBABILIDAD
EVENTOS MUTUAMENTE EXCLUYENTES
1 Si A es un evento que pertenece al espacio
probabilístico, entonces tiene asociada una Cuando dos o más eventos no pueden ocurrir al
probabilidad. mismo tiempo. Es decir, que la ocurrencia de un
2 La ley de no negatividad P(A) ≥ 0 para todo A. evento impide automáticamente la ocurrencia de
3 Si omega es el conjunto de todos los resultados otro.
posibles de un experimento aleatorio, entonces
P(Ω)=1 EVENTOS NO EXCLUYENTES
4 Si A1, A2, A3, ... es una sucesión de eventos Cuando es posible que dos o más eventos ocurran al
mutuamente excluyentes, entonces la probabilidad mismo tiempo. Sin embargo, no es necesario que los
de la unión de los eventos es igual a la suma de las dos eventos ocurran al mismo tiempo.
probabilidades de cada uno de los eventos.
8
ESTADÍSTICA Y PROBABILIDAD
EVENTOS COLECTIVAMENTE EXHAUSTIVOS
9
ESTADÍSTICA Y PROBABILIDAD
10
ESTADÍSTICA Y PROBABILIDAD
CONCEPTOS IMPORTANTES
12
ESTADÍSTICA Y PROBABILIDAD
con: 𝜆= n*p
Cuando n ≥ 30 y n*p < 5 o n*q < 5 se puede aproximar
DISTRIBUCION DE POISSON
UNIDAD 6: DISTRIBUCIÓN DE PROBABILIDADES
Se utiliza para determinar la probabilidad de que
PARA VARIABLES ALEATORIAS CONTINUAS
ocurra un número designado de eventos, cuando
éstos ocurren en un continuo de tiempo o espacio.
VARIABLES ALEATORIAS CONTINUAS
PROCESO POISSON
Es aquella variable que puede tomar cualquier valor
El proceso Poisson es similar al Bernoulli, excepto que fraccionario en un rango determinado de valores.
los eventos ocurren en un continuo en vez de ocurrir
Como existen valores infinitos, no pueden enlistarse
en ensayos fijos.
todos los valores posibles con una probabilidad
Se supone que los eventos son independientes y correspondiente. Para resolver este problema, se
estacionarios. define una función de densidad f(x). A la gráfica de
Se necesita el número promedio a largo plazo de una función de este tipo se le denomina curva de
probabilidad y el área entre dos puntos cualesquiera
eventos pata el tiempo o dimensión específico de
bajo la curva da la probabilidad de la ocurrencia
interés (λ). aleatoria de un valor entre esos dos puntos.
FÓRMULA
FÓRMULA
[ ]
2
(X −μ )
−
1 2σ
2
f ( x )= e
√2 π σ 2
El problema radica en que cada combinación
particular de µ y σ generan una distribución de APROXIMACION NORMAL A
probabilidad diferente, las tablas de las PROBABILIDAD BINOMIAL
probabilidades normales se basan en una distribución
Cuando el número de observaciones o ensayos es lo
específica: la distribución normal estándar.
suficientemente grande (n>30) y n*p≥5 (y n*q≥5),
DISTRIBUCION NORMAL ESTANDAR puede utilizarse la distribución normal para aproximar
a distribuciones de probabilidad binomiales.
Es un tipo de distribución normal de probabilidad que
Cuando se utiliza la distribución normal de
tiene media igual a 0 y desvío estándar igual a 1.
probabilidad como base para aproximar un valor
Cualquier valor de X, de una muestra o población con binomial de probabilidad, la media y la desviación
distribución normal, puede convertirse a su valor estándar se basan en el valor esperado y la varianza
normal estándar equivalente (Z). de número de éxitos de la distribución binomial.
Número promedio de éxitos: μ=np
FÓRMULA
Desviación estándar del número de éxitos: σ =√ npq
X−μ
z= CORRECION POR CONTINUIDAD
σ
Cuando se realiza una aproximación normal a una
probabilidad para variable aleatoria discreta, es
necesario realizar una corrección por continuidad. Se
requiere porque es necesario asignar toda el área bajo
la distribución normal continua a algún evento
Al transformar cualquier valor X a su correspondiente numérico, aun cuando no es posible tener un número
valor Z, podemos utilizar una tabla de distribución fraccionario de éxitos.
normal estándar, para obtener la probabilidad de
Siguiendo este razonamiento, el 0,5 se suma o se
ocurrencia de un determinado evento dentro de un
resta:
intervalo de dos valores.
15
ESTADÍSTICA Y PROBABILIDAD
√
σ N −n Por ello, si se tiene una muestra grande de ≥ 30,
σ x̄ = ∗ puede utilizarse la distribución normal de
√ n N −1
probabilidad junto con el error estándar de la media.
ERROR ESTANDAR ESTIMADO DE LA Además, si la población tiene una distribución normal
MEDIA y se conoce σ, podemos usar la distribución normal
Si se desconoce la desviación estándar de la para hacer inferencias a partir de muestras más
población, se puede estimar el error estándar de la pequeñas a 30.
media usando la desviación estándar de la muestra
como estimador de la desviación estándar de la
población.
RAZONAMIENTOS
FÓRMULA RAZONAMIENTO DEDUCTIVO: Se parte de lo general,
S para llegar a lo específico; con respecto al resultado
S x̄ =
√n muestral y con base en parámetros poblacionales
Agregando la corrección por población finita: conocidos. A partir de μ y σ calculamos la probabilidad
de una media muestral.
FÓRMULA
RAZONAMIENTO INDUCTIVO: Se parte de lo
S
S x̄ = ∗
N−n
√n N −1 √ específico y se llega a lo general; utilizando datos
muestrales para hacer afirmaciones acerca del valor
de la media poblacional.
UTILIDAD DE S x̄ o σ x̄
16
ESTADÍSTICA Y PROBABILIDAD
Supongamos que se especifica el tamaño que se desea También tenemos tablas para poder calcular las
en un intervalo de confianza y el grado de confianza proporciones de área bajo la distribución T. La
correspondiente. Si se conoce σ o se puede estimar, el distribución T, se basa en grados de libertad (gl) en
tamaño que se requiere, con base en la distribución cada situación. Para el caso de una muestra, gl = n –
normal, es: 1. Usamos esta distribución cuando n < 30, mientras
que si n > 30 (o los gl > 29) usamos la normal.
FÓRMULA Los valores T indican la proporción del extremo
( zσE )
2 superior de la distribución y no la proporción entre la
n= media y un punto como la distribución normal.
Cuando gl = n - 1, el intervalo de confianza para
INTERVALOS DE CONFIANZA PARA LA estimar la media de la población cuando se desconoce
PORPORCION, USANDO DISTRIBUCION σ, n < 30 y la población tiene una distribución normal
NORMAL es:
FÓRMULA
S ^p=
√ ^p (1− ^p )
n
Luego, el intervalo de confianza aproximado para una
UNIDAD 8: REGRESIÓN
CORRELACIÓN
LINEAL SIMPLE Y
proporción se obtiene:
ANALISIS DE REGRESION
FÓRMULA Consiste en desarrollar una ecuación de estimación
^p ± z∗S ^p que relaciona las variables conocidas con una variable
desconocida. Después de conocer el patrón de esta
DISTRIBUCION T DE STUDENT Y LOS relación, podremos aplicar el análisis de correlación
INTERVALOS DE CONFIANZA PARA LA para determinar el grado en el que las variables se
MEDIA relacionan.
Esta distribución se utiliza en caso de muestra El objetivo de este análisis es estimar el valor de una
variable aleatoria (llamada dependiente) conociendo
pequeña, población con distribución normal y cuando
el valor de una variable asociada (variable
no se conoce el valor de σ. independiente).
Si la población tiene una distribución normal, la El término regresión simple indica que se estima el
distribución muestral de la media de todas las valor de la variable dependiente con base a la una
variable independiente.
muestras que tomemos tendrán la misma distribución
por más que se desconozca σ.
17
ESTADÍSTICA Y PROBABILIDAD
Y i = valor de la variable dependiente en el i-ésimo
ensayo.
β 0 = parámetro de la regresión, valor de Y cuando
X=0.
β 1 = parámetro de la ecuación de regresión, que
indica la pendiente de la línea de regresión.
X i = valor de la variable independiente en el i-ésimo
SUPUESTOS GENERALES ensayo.
1 La variable dependiente es una variable aleatoria. ε i = error aleatorio de muestreo en el i-ésimo ensayo.
2 Las variables dependiente e independiente tienen Los valores β 0 y β 1 se estiman mediante valores b0 y
una relación lineal entre sí. b1 en base a la muestra que se obtenga:
3 Las varianzas de las distribuciones condicionales de
la variable dependiente, para diversos valores de la FÓRMULA
variable independiente, son iguales. Y^i=b0 +b1 X i
4 Para la estimación por intervalo, las distribuciones
La línea tendrá un “buen ajuste” si minimiza el error
condicionales de la variable dependiente, para
entre los puntos estimados en la recta y los puntos
valores diferentes de la variable dependiente, son observados reales que se utilizaron para trazarla.
todas distribuciones normales para la población de
Aplicando el criterio de los mínimos cuadrados, la
valores. línea de regresión que mejor se ajusta es aquella para
la cual se minimiza la suma de los cuadrados de las
DIAGRAMA DE DISPERSION desviaciones entre los valores estimados y los valores
observados de la variable dependiente.
Se construye con cada uno de los puntos que
representan el par de valores observados para las
variables dependiente e independiente. FÓRMULAS
La variable independiente se grafica en el eje
b 1=
∑ XY −n X Y
horizontal y el variable dependiente se grafica en el
eje vertical.
∑ X 2−n X 2
La forma de la relación entre las variables es b 0=Y −b1 X
representada el diagrama de dispersión.
RESIDUALES
18
ESTADÍSTICA Y PROBABILIDAD
Es la desviación estándar condicional de la variable Sin embargo, cuando la hipótesis nula dice que la
dependiente Y ,dado un valor de la variable pendiente es cero, lo cual generalmente es el caso, se
independiente X . para datos poblacionales, el error simplifica la fórmula y se plantea de la siguiente
manera:
estándar del estimador se representa mediante le
símbolo σ Y . X . b1
t=
Sb1
La fórmula de desviaciones que permite estimar este
Entonces, si t > t*n-2 se rechaza la H0 (por lo tanto, β 1
valor con base en datos muestrales es:
es diferente de 0).
FÓRMULA
SY . X =
√ ∑ (Y −Y^ )2 = ∑ e2
n−2 √ n−2
PRUEBA DE HIPOTESIS Y^ o ^
μY =b 0 +b1∗x
Antes de analizar la regresión entre dos valores
debemos saber si existe tal relación. Para ello usamos ERROR ESTANDAR DE LA MEDIA
la prueba de hipótesis. CONDICIONADA
√
2
En esta prueba, la hipótesis nula se define: H 0 : β 1=0 1 ( X−X )
SY X =S Y X∗ +
n
∑ X 2−[ (∑ X ) /n ]
2
√
análisis de regresión dos estimaciones de parámetros, 2
b0 y b1. 1 ( X−X )
SY pron ó stico =S YX∗ 1+ +
n
∑ X 2−[ (∑ X ) /n ]
2
FÓRMULA GENERAL
Luego, el intervalo de confianza con n – 2 gl:
b1−(β 1)0
t=
Sb 1
^
μY ± t∗SY pronóstico
SY . X
En donde Sb = ANALISIS DE CORRELACION
1
√ ∑ X −n∗X 2 2
19
ESTADÍSTICA Y PROBABILIDAD
El objetivo de este análisis es medir el grado de 2
r =b0
∑ Y + ¿ b1 ∑ XY −n Y
2
¿
relación o asociación entre las variables. Se centrará el
∑ Y 2−nY 2
análisis en la correlación simple.
SUPUESTOS GENERALES
dependiente que queda explicada mediante esa UNIDAD 9: SERIES DE TIEMPO Y PRONÓSTICO
ecuación de regresión que ajustamos antes.
ANALISIS DE SERIES TEMPORALES
FÓRMULA PARA LA POBLACIÓN Es el procedimiento para identificar y separar los
2 patrones y tendencias relacionados con el tiempo que
2 σ XY
ρ =1− 2
están presentes en los valores observados de los
σY datos.
Una vez identificados estos factores, se puede
FÓRMULA PARA LA MUESTRA mejorar la interpretación de los valores históricos de
2
la serie de tiempo y se pueden realizar predicciones
2 S XY sobre el futuro.
r =1− 2
SY
COMPONENTES
FÓRMULA
MÉTODO: el componente cíclico puede identificarse Y =T ∗C∗E∗I
como el que persistiría en los datos luego de
eliminada la influencia del componente de tendencia. METODO DE SUAVIZACION EXPONENCIAL
Esta eliminación se realiza mediante:
Es un método de pronóstico basado en el análisis de
los componentes históricos de la serie de tiempo. Esta
FÓRMULA técnica utiliza un promedio móvil ponderado, en el
Y T∗C cual los pesos asignados se van reduciendo en forma
C= = ∗100 exponencial conforme mayor es la antigüedad de cada
YT T
período.
VARIACIONES ESTACIONALES (E)
SUAVIZACIÓN EXPONENCIAL SIMPLE:
Son movimientos ascendentes y descendentes
Y^ t +1=aY t +a ( 1−a ) Y t−1 +a ( 1−a ) Y t−2 +…+ a (1−a ) Y t −k
2 k
respecto de la tendencia que se consuman dentro de
un año y se repiten anualmente. Se identifican más en
Y^ t +1 = pronóstico para el siguiente período.
periodos trimestrales. Solo se aprecian si se tienen
datos trimestrales o mensuales. Los patrones de a = constante de suavización (0 ≤ a ≤1 ).
cambio son dentro de un mismo año, y dichos Y t = valor real para el período más reciente.
patrones se repiten cada año. Se utiliza la técnica Y t −1 = valor real para el período que precede al más
promedios móviles. Por ejemplo, ventas altas en reciente.
navidad y bajas después o consumos relacionados con
Y t −k = valor real para los k períodos precedentes al
las estaciones del año.
período más reciente.
MÉTODO: este análisis trata de identificar un número SUAVIZACION EXPONENCIAL SIMPLIFICADA
de índice estacional asociada a cada mes. Cada uno de
21
ESTADÍSTICA Y PROBABILIDAD
Dado que el procedimiento anterior es muy laborioso, ÍNDICES SIMPLES: Miden el cambio de una sola
en la práctica suele utilizarse una técnica simplificada variable. Por ejemplo, el precio de un solo producto.
que requiere de un pronóstico “semilla” inicial y evita ÍNDICES COMPUESTOS: Miden el cambio de un
grupo de variables.
determinar los pesos:
-Índices Agregados Simples: Suman los valores de las
variables y luego comparan.
SUAVIZACIÓN EXPONENCIAL SIMPLIFICADA:
-Índices Ponderados: Asignan una "importancia" o
Y^ t +1=Y^ t +a(Y t−Y^ t ) peso a cada variable dentro del grupo. Esto es
crucial cuando no todas las variables contribuyen
Como el valor más reciente de la serie debe estar por igual al fenómeno que queremos medir. Los más
disponible para pronosticar el siguiente, sólo puede conocidos son el Índice de Laspeyres y el Índice de
utilizarse la suavización exponencial para pronosticar Paasche.
el valor siguiente del período y no para diversos
períodos a futuro. Mientras más cercano a 1 se fije el
valor de la constante de suavización, más ponderado
estará el pronóstico con los resultados más recientes.
NUMEROS INDICES
Son herramientas fundamentales que nos permiten
medir y comparar cambios relativos en una variable o
un grupo de variables a lo largo del tiempo o entre
diferentes lugares.
COMPARACION RELATIVA
La clave de los números índices es que no nos
interesan los valores absolutos, sino su cambio
porcentual o proporcional respecto a un punto de
referencia. Este punto de referencia se conoce como
período base o base de comparación, y se le asigna un
valor de 100 (o 1, si se prefiere una escala decimal).
Todo lo demás se expresa en relación con esa base.
DONDE SE APLICAN?
Los números índices tienen una gran variedad de
aplicaciones prácticas:
-Medir la inflación/deflación: El Índice de Precios al
Consumidor (IPC) es el ejemplo más conocido,
indicando cuánto han cambiado los precios de una
canasta de bienes y servicios representativa.
-Analizar el crecimiento económico.
-Evaluar el poder adquisitivo.
-Comparar rendimientos.
-Estudios de productividad.
22