0% encontró este documento útil (0 votos)
36 vistas22 páginas

Resúmen EyP

El documento aborda conceptos fundamentales de estadística y probabilidad, incluyendo análisis de datos, tipos de variables, muestreo y técnicas de presentación de datos. Se describen métodos de estadística descriptiva e inferencial, así como medidas de posición y variabilidad, como media, mediana y desviación estándar. Además, se presentan herramientas gráficas como histogramas y diagramas de tallos y hojas para organizar y visualizar datos.

Cargado por

Lucia Casale
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
36 vistas22 páginas

Resúmen EyP

El documento aborda conceptos fundamentales de estadística y probabilidad, incluyendo análisis de datos, tipos de variables, muestreo y técnicas de presentación de datos. Se describen métodos de estadística descriptiva e inferencial, así como medidas de posición y variabilidad, como media, mediana y desviación estándar. Además, se presentan herramientas gráficas como histogramas y diagramas de tallos y hojas para organizar y visualizar datos.

Cargado por

Lucia Casale
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

ESTADÍSTICA Y PROBABILIDAD

UNIDAD 1: ANÁLISIS DE DATOS DE NEGOCIOS INDIVIDUOS: Elementos individuales de la


población.
ESTADISTICA VARIABLES: Características de los individuos.
Se refiere a las técnicas mediante las cuales se VARIABLES CATEGORICAS
recopilan, organizan y analizan datos cuantitativos.
Además, es una ciencia que le extrae información a Dentro de esta variable, existen dos más, las variables
los datos, ayudando principalmente a la toma de nominales, utilizadas para clasificar; y las ordinales,
decisiones y a cuantificar el riesgo de una decisión usadas para jerarquizar. Ambas no pueden ser
equivocada. medidas numéricamente.

ESTADISTICA DESCRIPTIVA VARIABLES NUMERICAS

Incluye las técnicas que se relacionan con el resumen Hay dos tipos, las variables discretas , que solo
y la descripción de datos numéricos. Estos métodos pueden tener valores observados en puntos
pueden ser gráficos, diagramas, indicadores como aislados a lo largo de una escala y sus valores se
promedios, porcentajes o índices. Es un método expresan en números enteros .
“exacto”.
Las variables continuas , pueden suponer un valor
en cualquier punto fraccionario de un intervalo
INFERENCIA ESTADISTICA
específico.
Comprende aquellas técnicas por medio de las cuales
se toman decisiones sobre una población estadística Con ambas se pueden realizar operaciones
basadas en una muestra o en juicios de los algebraicas.
administradores. Se toman decisiones en un contexto
de incertidumbre, por lo que no es un método exacto. ESCALAS DE MEDICION

DATOS CATEGORICOS
POBLACION
En una escala nominal, no hay un orden jerárquico,
Conjunto de todos los elementos que estamos como es el caso del género.
estudiando, acerca de los cuales intentamos sacar
En una escala ordinal, si existe un orden jerárquico,
conclusiones. Las medidas de una población se
como es el caso del grado de instrucción.
denominan parámetros y se miden en censos.
DATOS NUMERICOS
MUESTRA En una escala de intervalo, existe orden y una medida
Parte de una población que se considera de distancia entre dos observaciones cualquiera. El
representativa de la misma para obtener resultados cero de la escala es convencional y los cocientes no
válidos. Las medidas se llaman estadísticas muestrales tienen significado.
y se miden con una encuesta.
En una escala de razón, existe orden y una medida de
M. Homogénea: Individuos que provienen de la distancia entre dos observaciones cualquiera, pero
misma población. hay un punto de partida, que es el cero, y los
cocientes si tienen significado.
M. Independencia: Observaciones no condicionadas.
M. Representativa: Selección que refleje a la
población de origen.

1
ESTADÍSTICA Y PROBABILIDAD
MUESTREO ALEATORIO UNIDAD 2: ORGANIZACIÓN Y PRESENTACIÓN DE
DATOS
Es aquel en el que cada uno de los elementos de la
población de interés, tiene una probabilidad conocida DIAGRAMA DE TALLOS Y HOJAS
y frecuentemente igual, de ser elegido. Se calcula un
error estándar, insesgado matemáticamente y es más Este diagrama es una de las formas más sencillas para
organizar datos. Nos permite observar la distribución
utilizado en investigaciones cuantitativas.
de los datos.
Aleatorio simple: Existe la misma probabilidad de Consiste en separar los datos en “dígitos guía” o
selección y se necesitan los elementos de la población “tallos” y en “dígitos rastreros” u “hojas”.
y numerarlos. Se pueden observar aspectos relacionados con la
dispersión o el sesgo de los datos. También se pueden
Sistemático: Muestra por unidades regulares de observar la presencia de datos extremos, que pueden
tiempo, orden o espacio y se necesitan los elementos afectar a algunos de los parámetros/estadísticos.
de la población. Pasos para construirlo:
1 Ordenar los valores de manera ascendente.
Estratificado: Demanda un conocimiento previo de la
2 Definir los “tallos” y “hojas”.
población; se divide en estratos con caract. similares 3 Construir el diagrama: se puede agrupar en
entre sí, pero cada estrato tiene caract. diferentes; se menos o más tallos.
usa para poblaciones heterogéneas.
DISTRIBUCION DE FRECUENCIAS
Conglomerados: Se eligen de manera aleatoria con
Es una tabla en la cual se agrupan en clases los
algún criterio común y se construye una muestra con valores posibles para una variable y se registra un
ellos; para poblaciones en las que no se tiene un número de valores observados que corresponde a
listado actualizado. cada clase. Los datos organizados se denominan
datos agrupados.
MUESTREO NO ALEATORIO Pasos para construirlo:
La selección la realiza el investigador, por lo que existe 1 Definir las categorías o agrupamientos (clases). El
un sesgo matemático. No se estima un error asociado número de clases depende de las necesidades de
y es más utilizado en investigaciones cualitativas. cada analista.
2 Definir el ancho de clase (amplitud del intervalo):

FÓRMULA PARA INTÉRVALO


Xmayor−Xmenor
Intervalo=
Número de clases

El punto medio del intervalo se denomina marca


de clase.
3 Registrar los datos en una tabla, colocando en
cada clase la cantidad de datos que cumplen con
esa condición. Esa cantidad se llama frecuencia
absoluta.
4 Registrar las demás frecuencias:
- Frecuencias Absolutas Acumuladas.
- Frecuencias Relativas y las Relativas
Acumuladas.
- Frecuencias Porcentuales y las Porcentuales
Acumuladas.
2
ESTADÍSTICA Y PROBABILIDAD
FORMAS DE ASIMETRIA
5 Gráficos:
- Datos categóricos, de barra y torta. 1 A. Negativa: “cola” hacia la izquierda.
- Datos numéricos, histograma, polígono, curva 2 Simétrica
de frecuencias, ojiva y gráfico de caja.
3 A. Positiva: “cola” hacia la derecha.
DISTRIBUCION DE FRECUENCIAS
RELATIVAS

Es aquella en la que el número de observaciones de


cada clase se convierte en una frecuencia relativa
dividiéndolo entre el número total de observaciones 1 Platikúrtica: Plana, con las observaciones
en la distribución. distribuidas de manera relativamente uniforme
HISTOGRAMAS en todas las clases.
2 Leptokúrtica: Puntiaguda, con las observaciones
Es la gráfica de barras de una distribución de concentradas en un estrecho rango de valores.
frecuencias.
3 Mesokúrtica: Ni plana ni puntiaguda, en
Sobre el eje horizontal se colocan los límites de clase, términos de la distribución de los valores
y sobre el vertical el número de observaciones. observados.
Pueden utilizarse las frecuencias absolutas, las
relativas o las porcentuales.

En el eje de las abscisas se representan los límites de


los intervalos de clases.
DISTRIBUCION DE FRECUENCIAS ACUMULADAS

Identifica el número de observaciones acumuladas


incluidas bajo el límite exacto superior de cada clase
de la distribución.
La gráfica de una distribución de frecuencias
acumuladas se denomina ojiva. Cuando dicha gráfica
POLIGONO DE FRECUENCIAS de línea está suavizada, se la denomina curva ojiva.
Es la gráfica lineal de una distribución de frecuencias.
En el eje de las abscisas están representadas las
marcas de clases.

-El cuartil 1 (Q1), divide a la población en 25% - 75%.


-El cuartil 2 (Q2), divide a la población en 50% - 50%.
-El cuartil 3 (Q3), divide a la población en 75% - 25%.
CURVA DE FRECUENCIAS
Es la suavización del polígono.

3
ESTADÍSTICA Y PROBABILIDAD
UNIDAD 3: MEDIDAS DE POSICIÓN Y DE suman estos productos (∑) para después dividir esta
VARIABILIDAD suma entre el número total de observaciones (∑f)
representadas en la distribución de frecuencias.
MEDIDAS DE POSICION
MEDIANA
Es un valor que se calcula para un grupo de datos y
que se utiliza para describirlos de alguna manera. Es el valor del dato que ocupa un lugar central cuando
Normalmente se desea que el valor sea se los agrupa a todos en orden ascendente o
representativo de todos los valores incluidos en el descendente. Se supone que se encuentra en la mitad
entre los dos valores adyacentes al centro.
grupo.

MEDIA FÓRMULA
Med =X
MEDIA ARITMETICA [ ( n2 )+( 12 )]
Se define como la división de la suma de todos los MEDIANA PARA DATOS AGUPADOS
valores entre el número de valores.
Primero se debe determinar la clase que contiene el
valor de la mediana.
FÓRMULA

Población: μ=
∑X Muestra: X=
∑X FÓRMULA
N n

( )
N
−fa A
MEDIA PONDERADA 2
Med =LI . .i
fc
Es una medida aritmética en la cual se considera a
cada uno de los valores de acuerdo con su MODA
importancia en el grupo.
Es el valor que se presenta con mayor frecuencia en
FÓRMULA un conjunto de datos.
Si una distribución tiene una sola moda, se la llama
μ p o X P=
∑ (pX ) unimodal. Si ningún número se repite, no tiene moda.
∑p Si hay dos valores que se repiten, es bimodal; y si hay
Cada uno de los valores del grupo (X) se multiplica por muchos, se llama multimodales.
el factor de ponderación apropiado (p) y después se MODA PARA DATOS AGRUPADOS
suman estos productos y la suma se divide entre las
ponderaciones. Primero se identifica la clase que contiene la moda
determinando cuál de ellas tiene el mayor número de
MEDIA ARITMETICA PARA DATOS
observaciones.
AGRUPADOS

Se utiliza el punto medio de cada clase como FÓRMULA


aproximación de todos los valores contenidos en ella.

FÓRMULA
Moda=LI +
( d1
d 1+ d 2
.i
)
Población: μ=
∑ (f X c ) Muestra:
d1 = diferencia entre la frecuencia de la clase modal y
la frecuencia de clase anterior.
N
X=
∑ (fX ) d2 = diferencia entre la frecuencia de la clase modal y
la frecuencia de clase siguiente.
n
Cada punto medio de clase se multiplica ( X c) por la
frecuencia de clase correspondiente (f), luego se
4
ESTADÍSTICA Y PROBABILIDAD

RELACION ENTRE MEDIA, MEDIANA Y


MODA

Las diferencias entre estas tres medidas permiten


saber la forma de la curva de frecuencias en términos
de asimetría.
RESUMEN DE LOS CINCO NUMEROS

[Link] valores de las tres son iguales.


[Link] media es el mayor valor de los tres. Dichos números, son el Xmenor (LI del primer intervalo),
c. La media es el menor valor de los tres. Q1, Q2, Q3, y el Xmayor (LS del último intervalo).
CUARTILES, DECILES Y PERCENTILES RANGO MEDIO
Subdividen una distribución de mediciones de Es el promedio entre el valor mayor y el valor menor
acuerdo con la proporción de frecuencias observadas. de nuestra tabla de datos.

FÓRMULAS FÓRMULA

([ 24n )+( 12 )]
Q 2= X
EJE MEDIO
Rango medio=( X mayor −X menor ) /2

3
[ 10 2 ]
D = X ( )+ ( )
3n 1
Medida de resumen que se utiliza para superar los
posibles problemas derivados de la presencia de
P =X (
70
[ 70100n )+( 12 ) ] valores extremos en los datos.

Con estas fórmulas, se encuentra la posición del valor. FÓRMULA

CUARTILES, DECILES Y PERCENTILES Eje medio=( Q1+Q3 ) /2


PARA DATOS AGRUPADOS
MEDIDAS DE VARIABILIDAD
En primer lugar, se determina la clase que contiene el
punto de interés, de acuerdo con las frecuencias Estas medidas se ocupan de describir la variabilidad
acumuladas, y después se lleva a interpolación. entre los valores. Mediante distintas técnicas se
puede medir la magnitud de la variabilidad en un
FÓRMULAS conjunto de datos.

( )
2n
−fa A RANGO
4
Q2=L I + .i
fc Es la diferencia entre los valores mayor y menor del
conjunto de datos.

( )
3n
−fa A
10
D3=L I + .i FÓRMULA
fc
Rango=My−Mn

( )
70 n
−fa A RANGO INTERCUARTIL
100
P70=L I + .i
fc
5
ESTADÍSTICA Y PROBABILIDAD
Es la diferencia entre el tercer cuartil y el primer Se asume que el punto medio de cada clase
cuartil en una distribución. Mide la dispersión del 50% representa a todas las mediciones incluidas en esa
de los datos centrales de una distribución. clase.

FÓRMULA
FÓRMULAS
Rango intercuartil=Q3−Q1
Población: σ 2=∑ ¿ ¿ ¿
DESVIACION MEDIA
Muestra: s2=
∑ [f ( X− X )2 ]
Se basa en la diferencia entre el valor absoluto de n−1
cada uno de los elementos del conjunto de datos y la
media del grupo.
DESVIACION ESTANDAR
FÓRMULA
Como es difícil interpretar el significado del valor de
DM poblacional=
∑ |X −μ| una varianza porque las unidades se expresan al
N cuadrado; se utiliza con mayor frecuencia la raíz

DM muestral=
∑ |X −X| cuadrada de la varianza, llamada desviación estándar.
n
FÓRMULAS
DESVIACION MEDIA PARA DATOS
AGRUPADOS

Se asume que el punto medio de cada clase


Población: σ 2=
√ ∑ (X −μ 2)
N


representa a todas las mediciones incluidas en cada
∑ ( X −X )
2
clase. Muestra: s2=
n−1
FÓRMULA DESVIACION ESTANDAR PARA DATOS

DM poblacional=
∑ (f |X −μ|) AGRUPADOS
N

DM muestral=
∑ ( f |X −X|) FÓRMULAS
n Población: σ 2= √∑ ¿ ¿ ¿ ¿
VARIANZA

Se basa en la diferencia entre cada uno de los valores


Muestra: s2=
√ ∑ [ f ( X−X )2]
n−1
COEFICIENTE DE VARIACION
del conjunto de datos y la media del grupo, antes de
sumarlas, se eleva al cuadrado cada una de las Indica la magnitud relativa de la desviación estándar
diferencias. con respecto a la media de distribución.

FÓRMULAS FÓRMULAS

Población: σ 2= ∑
2
(X −μ) σ s
Población: CV = Muestra: CV =
N μ X

Muestra: s = ∑
2
(X− X) COEFICIENTE DE ASIMETRIA DE
2
PEARSON
n−1
Mide la desviación de la simetría, expresando la
VARIANZA PARA DATOS AGRUPADOS diferencia entre la media y la mediana con respecto a
la desviación estándar del grupo de mediciones.
6
ESTADÍSTICA Y PROBABILIDAD
FÓRMULAS Ejemplos
3 (μ−Med ) Fr (m-2s ; m+2s) ≥ 0,75 ; 0,75 = 1 – (1/22)
Asimetría poblacional =
σ
3 ( X−Med ) Fr (m-3s ; m+3s) ≥ 0,895 ; 0,895 = 1 - (1/32)
Asimetría muestral=
s Fr (m-4s ; m+4s) ≥ 0,94 ; 0,94 = 1 - (1/42)
Simétrica: el valor es cero (la media y la mediana
iguales).
Asimetría positiva: el valor es positivo (la media es
mayor a la mediana).
Asimetría negativa: el valor es negativo (la media es
menor que la mediana).
UNIDAD 4: PROBABILIDAD
USO DE LA DESVIACION ESTANDAR
PROBABILIDAD
Ésta, es la medida más importante, ya que se utiliza
junto con varios métodos de inferencia estadística. Es la medición de la posibilidad de que ocurra un
Como ejemplo de su uso, considérese una distribución evento particular.
de frecuencias que es al mismo tiempo simétrica y El estudio matemático de la aleatoriedad se llama
mesokúrtica. Teoría Probabilística.
El análisis estadístico a una curva de frecuencias con ENFOQUES CONCEPTUALES
estas características se la denomina curva normal.
REGLA EMPIRICA ENFOQUE CLÁSICO: La probabilidad de que ocurra un
evento se calcula como la cantidad de casos
Para una distribución que tiene una distribución favorables a dicho evento sobre el total de resultados
normal, se sabe que aproximadamente el 68% de las igualmente posibles.
mediciones se encuentra a no más de una Desviación
Estándar de la Media y que aproximadamente el 95% FÓRMULA
de las mediciones se encuentran a no más de dos
número de casos favorables
Desviaciones Estándar de la Media. P ( A )=
número de casos posibles
- Todos los resultados son igualmente posibles.
- Los resultados son mutuamente excluyentes.
- Valor de probabilidad objetivo.
ENFOQUE FRECUENCIAL: La probabilidad se basa en la
cantidad de veces que ocurre un evento en un
determinado número de observaciones o
experimentos.
TEOREMA DE CHEBYSHEV
FÓRMULA
Este teorema se utiliza cuando la distribución no tiene
número de observaciones
distribución normal. P ( A )=
tamaño de muestra
La probabilidad de que cualquier variable aleatoria X
tome un valor entro de K desviaciones estándar de la - Los resultados son mutuamente excluyentes.
media es de al menos 1-1/K2. Es decir, - Valor de probabilidad objetivo.
1 ENFOQUE SUBJETIVO: Es el “grado de confianza” que
P ( μ−Kσ < X < μ+ Kσ ) ≥ 1−
K
2 alguien tiene de que ocurra un evento, con base en
toda la evidencia que tiene disponible.
El teorema es válido siempre que K > 1.
7
ESTADÍSTICA Y PROBABILIDAD
- El valor de la probabilidad está sujeto a un juicio P (A1 U A2 U A3 U …) = P(A1) + P (A2) + P(A3) + ...
personal. 5 La probabilidad del evento imposible es igual a cero.
EXPRESION DE LA PROBABILIDAD P(Ø) = 0
6 El evento complemento de A es el evento que
P (A), significa la probabilidad de que ocurra el evento consiste en todos los resultados que no pertenecen
A en una sola observación.
al conjunto A.
El menor valor que puede tener una probabilidad es 0 Si A U A’= Ω entonces P (A U A’) = 1
(evento imposible), y el mayor valor que puede tomar P (A) + P (A’) = 1 P (A) = 1 - P (A’)
es 1 (es seguro que ocurra).
7 La probabilidad es un número que varía entre 0 y 1.
La suma de la probabilidad de ocurrencia (A) más la de 0 ≤ P(A) ≤ 1
no ocurrencia (A’) siempre es igual a 1.
P ( A ) + P ( A ' )=1
DIAGRAMA DE VENN CONCEPTOS BASICOS
Es un diagrama que permite ilustrar los eventos que ESPACIO PROBABILÍSTICO O MUESTRAL: Conjunto de
pueden ocurrir en una observación. Una figura todos los resultados posibles de un experimento
cerrada representa un espacio muestral, y se utilizan aleatorio, se simboliza con omega (Ω).
porciones del área dentro de ese espacio para
representar eventos elementales o compuestos o Cada punto del espacio muestral corresponde a un
espacios de eventos. experimento, es mutuamente excluyente de los
restantes y todos los eventos deben ser
colectivamente exhaustivos.
EVENTO O SUCESO: Se trata de cada uno de los
resultados posibles de un experimento.
Cada evento tiene asociada una probabilidad. Si
La expresión de probabilidad se representa en este combinamos eventos simples, obtenemos eventos
diagrama como la proporción, razón, cociente entre el compuestos.
número relativo de resultados favorables de A (a) EVENTO SIMPLE: Contiene exactamente un punto de
respecto al número relativo de resultados A’ (b). muestra en omega.
Ejemplo: en la tirada de un dado el espacio
FÓRMULA probabilístico sería la salida de (1, 2, 3, 4, 5, 6).
N ( A) a EVENTO COMPUESTO: Contienen más de un punto de
P ( A )= = muestra del espacio.
N (S ) a+b
AXIOMAS DE LA TEORIA DE
Ejemplo: salida de número par (del 1 al 6), incluye
tres eventos simples.
PROBABILIDAD
EVENTOS MUTUAMENTE EXCLUYENTES
1 Si A es un evento que pertenece al espacio
probabilístico, entonces tiene asociada una Cuando dos o más eventos no pueden ocurrir al
probabilidad. mismo tiempo. Es decir, que la ocurrencia de un
2 La ley de no negatividad P(A) ≥ 0 para todo A. evento impide automáticamente la ocurrencia de
3 Si omega es el conjunto de todos los resultados otro.
posibles de un experimento aleatorio, entonces
P(Ω)=1 EVENTOS NO EXCLUYENTES
4 Si A1, A2, A3, ... es una sucesión de eventos Cuando es posible que dos o más eventos ocurran al
mutuamente excluyentes, entonces la probabilidad mismo tiempo. Sin embargo, no es necesario que los
de la unión de los eventos es igual a la suma de las dos eventos ocurran al mismo tiempo.
probabilidades de cada uno de los eventos.
8
ESTADÍSTICA Y PROBABILIDAD
EVENTOS COLECTIVAMENTE EXHAUSTIVOS

Su unión es igual al espacio probabilístico.


Ejemplo: evento A, salida de 1 o 2; evento B, salida de
3 o 4; evento C, salida de 5 o 6.
AυBυC=Ω

9
ESTADÍSTICA Y PROBABILIDAD

REGLA DE ADICION REGLA DE MULTIPLICACION


Se utiliza cuando se desea determinar la probabilidad Se refiere a la determinación de la probabilidad de la
de que ocurra un evento u otro (o ambos) en una sola ocurrencia conjunta de A y B.
observación. Se puede construir Diagramas de Árbol, para ilustrar
los posibles eventos asociados con observaciones.
FÓRMULA
Para A y B que son mutuamente excluyentes:
P ( A o B )=P ( A ∪ B )=P ( A ) + P(B)
Para A y B que no son mutuamente excluyentes:
P ( A y B )=P ( A )+ P ( B )−P ( A ∩ B )
FÓRMULA
EVENTOS INDEPENDIENTES
Para eventos independientes:
Cuando la ocurrencia o no ocurrencia de uno no tiene
P ( A y B )=P ( A ∩ B )=P ( A ) x P (B)
ningún efecto sobre la probabilidad de ocurrencia del
otro. Para eventos dependientes:
No se utiliza la probabilidad condicional, ya que por P ( A y B )=P ( A ) x P ( B| A )
definición no existe relación entre los eventos.
P ( B y A )=P ( B ) x P ( A|B )

FÓRMULA TEOREMA DE BAYES


Para probar la independencia de A y B, se puede
Hace referencia a la probabilidad condicional de un
comparar:
evento A dado que se dio el evento B, tal como se vio
P ( B| A ¿=P(B) anteriormente, pero teniendo en cuenta un evento
posterior para la condicionalidad (B pasó después de
P ( A|B ¿=P( A) A).
EVENTOS DEPENDIENTES La importancia, consiste en que se aplica en el
contexto de eventos secuenciales, y en que la versión
La ocurrencia o no ocurrencia de un evento si afecta a
la ocurrencia del otro evento. de cálculo de la fórmula proporciona la base para
determinar la probabilidad condicional de un evento
PROBABILIDAD CONDICIONAL que ha ocurrido en la primera posición secuencial,
Se utiliza para designar la probabilidad de ocurrencia dado que se ha observado un evento específico en la
de un evento relacionado. segunda posición secuencial.
P (B|A) indica la probabilidad de un evento B dado
que ocurre A. FÓRMULA
P ( A ) xP (B∨ A)
FÓRMULA P ( A|B )=
P ( A ) xP ( B| A )+ P ( A ' ) xP(B∨A ' )
P( A y B)
P ( B| A )=
P( A)

10
ESTADÍSTICA Y PROBABILIDAD

TABLAS DE PROBABILIDAD CONJUNTA

Se utilizan para el cálculo de probabilidades de COMBINACIONES


eventos conjuntos diversos. Lo importante en las combinaciones es el número de
agrupaciones diferentes de objetos que pueden
Es una tabla en la cual se enlistan como encabezados ocurrir sin importar su orden.
de renglón todos los posibles eventos para una
variable; como encabezados de columnas se enlistan
todos los posibles eventos para una segunda variable, FÓRMULA
y el valor que se anota en cada una de las celdas de El número de combinaciones de n objetos tomados r a
una tabla es la probabilidad de su ocurrencia la vez es:
conjunta.
n!
La tabla de frecuencias de ocurrencia conjuntas que
nCr=
r ! ( n−r ) !
puede servir como base para construir una tabla de
probabilidades conjuntas se denomina tabla de UNIDAD 5: DISTRIBUCIÓN DE PROBABILIDADES
contingencias. PARA VARIABLES ALEATORIAS DISCRETAS

CONCEPTOS IMPORTANTES

Las distribuciones de probabilidad están relacionadas


con las distribuciones de frecuencias. De hecho,
podemos pensar que una distribución de probabilidad
es una distribución de frecuencias teórica.
DISTRIBUCIÓN DE FRECUENCIAS TEÓRICA:
distribución de probabilidades que describe la forma
En las tablas de probabilidad conjunta, se denomina en que se espera varíen los resultados. Inferencias en
probabilidad marginal a las probabilidades que son un contexto de incertidumbre.
total marginal de renglón o de columna. Son
DISTRIBUCIÓN DE FRECUENCIAS: listado de
probabilidades simples de eventos específicos.
frecuencias observadas de todos los resultados de un
experimento.
PERMUTACIONES
DISTRIBUCIONES DE PROBABILIDAD
Se utilizan para contar de modo directo los resultados
PARA VARIABLES ALEATORIAS
probables de un espacio muestral.
Permutaciones de n objetos: número de formas en Una variable aleatoria es una variable cuyo valor no se
que los elementos se pueden acomodar en puede predecir con certeza, sino que depende del
determinado orden. azar o de factores desconocidos.
n !=( n ) x ( n−1 ) x … x (2)x (1) Cuando se asignan valores de probabilidad a todos los
valores numéricos posibles de una variable aleatoria
n! = n factorial (donde n es siempre positiva y 0! = 1) X, se obtiene como resultado una distribución de
Para saber permutaciones de un subgrupo de n probabilidad.
objetos en lugar de elegir a todos los n objetos, Para una variable aleatoria discreta, se pueden
buscamos el número de permutaciones de n objetos enlistar todos los valores numéricos posibles de una
tomados por r a la vez en donde r es menor que n. variable en una tabla con las probabilidades
correspondientes.
FÓRMULA Para una variable aleatoria continua no es posible
n! enlistar todos los posibles valores la variable, por lo
nPr= tanto, las probabilidades que se determinan a través
( n−r ) !
11
ESTADÍSTICA Y PROBABILIDAD
de una función matemática se ilustran en forma Puede utilizarse la distribución binominal para
gráfica mediante una función de densidad de determinar la probabilidad de obtener un número
probabilidad o curva de probabilidad. determinado de éxitos en un proceso Bernoulli.
VALOR ESPERADO
Se requieren tres valores: el número específico de
Es la media, a largo plazo, de una variable aleatoria X, éxitos (X), el número de ensayos u observaciones (n) y
y se denota mediante E(X). Para una variable aleatoria la probabilidad de éxito en cada uno de los ensayos
discreta, resulta ser el promedio ponderado de todos (p).
los valores numéricos posibles de una variable.
FÓRMULA
FÓRMULA
E ( X )=∑ XP ( X )

VARIANZA DISTRIBUCION BINOMIAL CON TABLAS


La varianza de una variable aleatoria X se denota V(X); Cuando las muestras son grandes es posible utilizar
se calcula con respecto a E(X) como la media de la
algunas tablas que contienen los valores de
distribución de probabilidad.
probabilidad para determinados valores de X, de n, y
de p.
FÓRMULA
La forma general de desviaciones para la fórmula de la VALOR ESPERADO Y VARIANZA EN LA
varianza de una variable aleatoria discreta es: DISTRIBUCION BINOMIAL
V ( X )=∑ [ X −E( X )] P( X )
2
VALOR ESPERADO: es igual a la proporción de éxitos
multiplicada por el tamaño de la muestra
DISTRIBUCION BINOMINAL
E ( X )=n . p
Es una distribución discreta de probabilidad aplicable
VARIANZA: es posible calcularla de la siguiente forma:
como modelo a diversas situaciones de toma de
decisiones, siempre y cuando pueda suponerse que el V ( X )=n . p . q
proceso de muestreo se ajusta a un proceso Bernoulli.
DISTRIBUCION BINOMIAL MEDIANTE
PROPORCIONES

En lugar de expresar la variable aleatoria binomial

términos de la proporción de éxitos 𝑝, que es el


como el número de éxitos X, puede designarse en

cociente entre el número de éxitos y el número de


PROCESO BERNOULLI
ensayos:
Es un proceso de muestreo en el que:
1 Sólo son posibles dos resultados mutuamente FÓRMULA
excluyentes en cada ensayo u observación. A estos
resultados se los denomina éxito y fracaso.
2 Los resultados del conjunto de ensayos,
constituyen eventos independientes.
3 La probabilidad de éxito, que se denota mediante
P, permanece constante de un ensayo a otro. El p .q
E ( ^p )= p=π V ( ^p )=
proceso es estacionario. n

12
ESTADÍSTICA Y PROBABILIDAD

con: 𝜆= n*p
Cuando n ≥ 30 y n*p < 5 o n*q < 5 se puede aproximar

DISTRIBUCION DE POISSON
UNIDAD 6: DISTRIBUCIÓN DE PROBABILIDADES
Se utiliza para determinar la probabilidad de que
PARA VARIABLES ALEATORIAS CONTINUAS
ocurra un número designado de eventos, cuando
éstos ocurren en un continuo de tiempo o espacio.
VARIABLES ALEATORIAS CONTINUAS
PROCESO POISSON
Es aquella variable que puede tomar cualquier valor
El proceso Poisson es similar al Bernoulli, excepto que fraccionario en un rango determinado de valores.
los eventos ocurren en un continuo en vez de ocurrir
Como existen valores infinitos, no pueden enlistarse
en ensayos fijos.
todos los valores posibles con una probabilidad
Se supone que los eventos son independientes y correspondiente. Para resolver este problema, se
estacionarios. define una función de densidad f(x). A la gráfica de
Se necesita el número promedio a largo plazo de una función de este tipo se le denomina curva de
probabilidad y el área entre dos puntos cualesquiera
eventos pata el tiempo o dimensión específico de
bajo la curva da la probabilidad de la ocurrencia
interés (λ). aleatoria de un valor entre esos dos puntos.

FÓRMULA

Siendo e una constante (e = 2,78193)


Como se supone que es estacionario, se concluye que
la media del proceso es siempre proporcional a la DISTRIBUCION NORMAL
longitud del continuo de tiempo o espacio. Por lo
tanto, si se tiene disponible una media para una Es una distribución continua de probabilidad que es, al
longitud de tiempo, puede determinarse la media mismo tiempo, simétrica y mesokúrtica.
para cualquier otro periodo de tiempo que se
requiera.

También pueden utilizarse las tablas, para calcular las


probabilidades, conociendo los valores de X y λ.

VALOR ESPERADO: de una distribución de


probabilidad, por definición es igual a la media de la Es una distribución muy usada para la inferencia
distribución. estadística, por 3 razones:
E ( X )=λ - Muchas mediciones que se obtienen de procesos
VARIANZA: del número de eventos de una aleatorios siguen esa distribución.
distribución de probabilidad, también es igual a la - Se puede usar esta distribución para aproximar
media de la distribución. otras distribuciones como la Poisson o Binomial.
- También, cuando la muestra es lo suficientemente
V ( X )= λ grande, la distribución de la media muestral y la
APROXIMACION DE POISSON A proporción muestral se comportan como la
PROBABILIDAD BINOMIAL distribución normal.
En el caso de las distribuciones continuas de
Cuando n es grande en Bernoulli, los cálculos se probabilidad sólo es posible determinar un valor de
tornan complejos de resolver. A demás, la tabla sólo probabilidad para un intervalo de valores. La altura de
tiene probabilidades tabuladas para n ≤ 30 y p ≥ 0,01. la función de densidad para una variable con
distribución normal está dada por:
13
ESTADÍSTICA Y PROBABILIDAD

FÓRMULA

[ ]
2
(X −μ )

1 2σ
2

f ( x )= e
√2 π σ 2
El problema radica en que cada combinación
particular de µ y σ generan una distribución de APROXIMACION NORMAL A
probabilidad diferente, las tablas de las PROBABILIDAD BINOMIAL
probabilidades normales se basan en una distribución
Cuando el número de observaciones o ensayos es lo
específica: la distribución normal estándar.
suficientemente grande (n>30) y n*p≥5 (y n*q≥5),
DISTRIBUCION NORMAL ESTANDAR puede utilizarse la distribución normal para aproximar
a distribuciones de probabilidad binomiales.
Es un tipo de distribución normal de probabilidad que
Cuando se utiliza la distribución normal de
tiene media igual a 0 y desvío estándar igual a 1.
probabilidad como base para aproximar un valor
Cualquier valor de X, de una muestra o población con binomial de probabilidad, la media y la desviación
distribución normal, puede convertirse a su valor estándar se basan en el valor esperado y la varianza
normal estándar equivalente (Z). de número de éxitos de la distribución binomial.
Número promedio de éxitos: μ=np
FÓRMULA
Desviación estándar del número de éxitos: σ =√ npq
X−μ
z= CORRECION POR CONTINUIDAD
σ
Cuando se realiza una aproximación normal a una
probabilidad para variable aleatoria discreta, es
necesario realizar una corrección por continuidad. Se
requiere porque es necesario asignar toda el área bajo
la distribución normal continua a algún evento
Al transformar cualquier valor X a su correspondiente numérico, aun cuando no es posible tener un número
valor Z, podemos utilizar una tabla de distribución fraccionario de éxitos.
normal estándar, para obtener la probabilidad de
Siguiendo este razonamiento, el 0,5 se suma o se
ocurrencia de un determinado evento dentro de un
resta:
intervalo de dos valores.

VALOR ESPERADO: E ( x )=μ CORRECIONES


VARIANZA: V ( x )=σ 2 Se resta 0,5 de X cuando P(X > X¡) se requiere.

PUNTOS PERCENTILES Se resta 0,5 de X cuando P(X < X¡) se requiere.


Se suma 0,5 de X cuando P(X < X¡) es requerido.
Los puntos percentiles son una manera de entender o
inferir algunas conclusiones acerca de los datos. Se suma 0,5 de X cuando P(X > X¡) es requerido.

Ejemplo: ¿Qué valores se encuentran por debajo del APROXIMACION NORMAL A


90% de los datos o encima del 10%? PROBABILIDADES DE POISSON
Para la distribución normal es un valor de Z (de la
Cuando la media (λ) de una distribución de Poisson es
tabla) tal que la proporción del área total a la
izquierda ese valor, bajo la curva normal, es 0,90. relativamente grande, puede utilizarse la distribución
normal de probabilidad para aproximar
probabilidades tipo Poisson. Una regla práctica
consiste en afirmar que esa aproximación es
aceptable cuando λ ≥ 10.
14
ESTADÍSTICA Y PROBABILIDAD
MEDIA: μ= λ ESTIMADORES PUNTUALES MÁS USADOS
DESVIACIÓN ESTANDAR: σ =√ λ
CORRECION POR CONTINUIDAD

Las reglas antes vistas sobre la corrección por


continuidad, se aplican de igual manera a la situación
en la que se utiliza la distribución normal para
ESTIMADOR POR INTERVALO
aproximar probabilidades Poisson. Siguiendo este
razonamiento, el 0,5 se suma o se resta. Es un rango de valores que se utiliza para estimar un
parámetro poblacional.
UNIDAD 7: ELEMENTOS DE MUESTREO E
INTERVALOS DE CONFIANZA CRITERIOS DE LOS ESTIMADORES

INFERENCIA ESTADISTICA Insesgado: su valor esperado es igual al parámetro


que se estima.
Es la rama de la estadística que se ocupa del uso de
los conceptos de probabilidad para manejar la Eficiente: con bajo desvío estándar.
incertidumbre en la toma de decisiones. Por ello, la Consistente: al aumentar el tamaño de la muestra, se
Teoría de Probabilidad es la base de la inferencia tiene casi la certeza de que el valor de la estadística se
estadística. aproxima bastante al valor del parámetro poblacional.
La inferencia estadística tiene como objetivos la Suficiente: no requiere otro estimador para extraer
estimación y la prueba de hipótesis. En ambas se información adicional acerca del parámetro de
hacen inferencias acerca de las características de las población que se está estimando.
poblaciones a partir de la información proporcionada
por las muestras. DISTRIBUCION MUESTRAL DE LA MEDIA
Podemos describir muestras y poblaciones al emplear Es la distribución de probabilidad de los valores
mediciones como la media, la desviación estándar y/o posibles de la media muestral, con base en un
la varianza. Una estadística es una característica de determinado tamaño de muestra.
una muestra y un parámetro es una característica de
Para una población con media μ y cualquier tamaño
una población.
de muestra n, los valores de la media muestra x̄
varían de una muestra a otra. Con ellas se construye la
distribución muestral de la media. Se describe
mediante:
VALOR ESPERADO: E ( x̄ )=μ
σ
Podemos hacer dos tipos de estimaciones respecto a DESVIACIÓN ESTÁNDAR: σ x̄ =
la población: √n
Esta última, también es un estimador puntual ya que
ESTIMACION PUNTUAL indica con cierta precisión la efectividad de la media
como estimador puntual. Se la conoce como error
Es un solo valor numérico basado en datos de una
estándar de la media.
muestra aleatoria que se utiliza para estimar el valor
de un parámetro poblacional. Se utilizan estimadores CORRECCION POR POBLACION FINITA
insesgados, es decir, es un estadístico muestral cuyo
valor esperado es igual al parámetro que se estima. Se utiliza cuando la población es finita.
Esta afirmación sólo tiene dos opciones: es correcta o Cuando n > 0,05*N, es decir, cuando el tamaño de la
está equivocada. No puede tener la certeza sobre si la muestra es mayor al 5% del tamaño de la población.
estimación es confiable.
FÓRMULA

15
ESTADÍSTICA Y PROBABILIDAD


σ N −n Por ello, si se tiene una muestra grande de ≥ 30,
σ x̄ = ∗ puede utilizarse la distribución normal de
√ n N −1
probabilidad junto con el error estándar de la media.
ERROR ESTANDAR ESTIMADO DE LA Además, si la población tiene una distribución normal
MEDIA y se conoce σ, podemos usar la distribución normal
Si se desconoce la desviación estándar de la para hacer inferencias a partir de muestras más
población, se puede estimar el error estándar de la pequeñas a 30.
media usando la desviación estándar de la muestra
como estimador de la desviación estándar de la
población.
RAZONAMIENTOS
FÓRMULA RAZONAMIENTO DEDUCTIVO: Se parte de lo general,
S para llegar a lo específico; con respecto al resultado
S x̄ =
√n muestral y con base en parámetros poblacionales
Agregando la corrección por población finita: conocidos. A partir de μ y σ calculamos la probabilidad
de una media muestral.
FÓRMULA
RAZONAMIENTO INDUCTIVO: Se parte de lo
S
S x̄ = ∗
N−n
√n N −1 √ específico y se llega a lo general; utilizando datos
muestrales para hacer afirmaciones acerca del valor
de la media poblacional.
UTILIDAD DE S x̄ o σ x̄

El error estándar de la media (o el error estándar INTERVALOS DE CONFIANZA PARA


estimado de la media) estima la dispersión de las ESTIMAR LA MEDIA POBLACIONAL USANDO
medias muestrales en torno a la verdadera media DISTRIBUCION NORMAL
poblacional.
Este intervalo mide la probabilidad de que se incluya
Dicho de otro modo, nos indica cuánto podemos en ese rango el valor de la media de la población. El
esperar que la media de una muestra aleatoria difiera grado de confianza asociado a un intervalo señala el
de la media poblacional real. Podemos utilizarla para: porcentaje a largo plazo de “confianza” que posee el
- Evaluar la precisión de nuestra estimación de la parámetro a estimar.
media poblacional. Mediante la distribución normal, los intervalos de
- Realizar la estimación por intervalo de la media confianza para la media se calculan:
poblacional.
- Determinar el tamaño de la muestra necesario
FÓRMULAS
para un estudio.
X ± z∗σ X X ± z∗S X
TEOREMA CENTRAL DEL LIMITE Siendo z∗σ X y z∗S X el error de estimación.
La mayoría de los intervalos utilizan un nivel de
Al aumentar el tamaño de la muestra, la distribución
confianza del 90%, 95% o 99%.
muestral de la media se aproximará a la forma de la
z Proporción de área en el intervalo
distribución normal sin importar la forma de la
1,645 0,90 o 90%
distribución de las mediciones individuales en la
1,96 0,95 o 95%
población. Para ser prácticos, se estima que la 2,58 0,99 o 99%
distribución muestral de la media es
aproximadamente normal cuando el tamaño de la
muestra es n ≥ 30.

16
ESTADÍSTICA Y PROBABILIDAD

TAMA ÑO DE LA MUESTRA Los valores en este caso se distribuyen de acuerdo a la


NECESARIO PARA ESTIMAR LA distribución T de Student, que es un poco más
MEDIA aplastada (platikúrtica).

Supongamos que se especifica el tamaño que se desea También tenemos tablas para poder calcular las
en un intervalo de confianza y el grado de confianza proporciones de área bajo la distribución T. La
correspondiente. Si se conoce σ o se puede estimar, el distribución T, se basa en grados de libertad (gl) en
tamaño que se requiere, con base en la distribución cada situación. Para el caso de una muestra, gl = n –
normal, es: 1. Usamos esta distribución cuando n < 30, mientras
que si n > 30 (o los gl > 29) usamos la normal.
FÓRMULA Los valores T indican la proporción del extremo

( zσE )
2 superior de la distribución y no la proporción entre la
n= media y un punto como la distribución normal.
Cuando gl = n - 1, el intervalo de confianza para
INTERVALOS DE CONFIANZA PARA LA estimar la media de la población cuando se desconoce
PORPORCION, USANDO DISTRIBUCION σ, n < 30 y la población tiene una distribución normal
NORMAL es:

Como podíamos aproximar la distribución binomial a FÓRMULA


la normal, es posible plantear la distribución normal
como manera de aproximar a la binomial al construir X ± t gl∗S X
intervalos de confianza para proporciones o
RESUMEN
probabilidades de éxitos p. Se puede aproximar la
binomial a la normal cuando: n ≥ 30 y np ≥ 5 o nq ≥ 5.
Se usa p de la muestra para calcular la desviación
estándar o error estándar:

FÓRMULA

S ^p=
√ ^p (1− ^p )
n
Luego, el intervalo de confianza aproximado para una
UNIDAD 8: REGRESIÓN
CORRELACIÓN
LINEAL SIMPLE Y

proporción se obtiene:
ANALISIS DE REGRESION
FÓRMULA Consiste en desarrollar una ecuación de estimación
^p ± z∗S ^p que relaciona las variables conocidas con una variable
desconocida. Después de conocer el patrón de esta
DISTRIBUCION T DE STUDENT Y LOS relación, podremos aplicar el análisis de correlación
INTERVALOS DE CONFIANZA PARA LA para determinar el grado en el que las variables se
MEDIA relacionan.

Esta distribución se utiliza en caso de muestra El objetivo de este análisis es estimar el valor de una
variable aleatoria (llamada dependiente) conociendo
pequeña, población con distribución normal y cuando
el valor de una variable asociada (variable
no se conoce el valor de σ. independiente).
Si la población tiene una distribución normal, la El término regresión simple indica que se estima el
distribución muestral de la media de todas las valor de la variable dependiente con base a la una
variable independiente.
muestras que tomemos tendrán la misma distribución
por más que se desconozca σ.
17
ESTADÍSTICA Y PROBABILIDAD
Y i = valor de la variable dependiente en el i-ésimo
ensayo.
β 0 = parámetro de la regresión, valor de Y cuando
X=0.
β 1 = parámetro de la ecuación de regresión, que
indica la pendiente de la línea de regresión.
X i = valor de la variable independiente en el i-ésimo
SUPUESTOS GENERALES ensayo.
1 La variable dependiente es una variable aleatoria. ε i = error aleatorio de muestreo en el i-ésimo ensayo.
2 Las variables dependiente e independiente tienen Los valores β 0 y β 1 se estiman mediante valores b0 y
una relación lineal entre sí. b1 en base a la muestra que se obtenga:
3 Las varianzas de las distribuciones condicionales de
la variable dependiente, para diversos valores de la FÓRMULA
variable independiente, son iguales. Y^i=b0 +b1 X i
4 Para la estimación por intervalo, las distribuciones
La línea tendrá un “buen ajuste” si minimiza el error
condicionales de la variable dependiente, para
entre los puntos estimados en la recta y los puntos
valores diferentes de la variable dependiente, son observados reales que se utilizaron para trazarla.
todas distribuciones normales para la población de
Aplicando el criterio de los mínimos cuadrados, la
valores. línea de regresión que mejor se ajusta es aquella para
la cual se minimiza la suma de los cuadrados de las
DIAGRAMA DE DISPERSION desviaciones entre los valores estimados y los valores
observados de la variable dependiente.
Se construye con cada uno de los puntos que
representan el par de valores observados para las
variables dependiente e independiente. FÓRMULAS
La variable independiente se grafica en el eje
b 1=
∑ XY −n X Y
horizontal y el variable dependiente se grafica en el
eje vertical.
∑ X 2−n X 2
La forma de la relación entre las variables es b 0=Y −b1 X
representada el diagrama de dispersión.
RESIDUALES

Para un valor X dado de la variable independiente, al


^ frecuentemente se le denomina el valor
valor Y
ajustado de la variable dependiente. A la diferencia
^ se lo
entre el valor observado Y y el valor ajustado Y
denomina residual para esa observación y se lo
denota mediante e:
METODO DE MINIMOS CUADROS PARA
AJUSTAR UNA LINEA DE REGRESION FÓRMULA
El modelo lineal que representa el modelo de e=Y −Y^
regresión lineal es: El conjunto de residuales para cada muestra nos sirve
para calcular el error estándar de la estimación.
FÓRMULA
ERROR ESTANDAR DE LA
Y i=β 0 + β 1 X i+ ε i
ESTIMACION

18
ESTADÍSTICA Y PROBABILIDAD
Es la desviación estándar condicional de la variable Sin embargo, cuando la hipótesis nula dice que la
dependiente Y ,dado un valor de la variable pendiente es cero, lo cual generalmente es el caso, se
independiente X . para datos poblacionales, el error simplifica la fórmula y se plantea de la siguiente
manera:
estándar del estimador se representa mediante le
símbolo σ Y . X . b1
t=
Sb1
La fórmula de desviaciones que permite estimar este
Entonces, si t > t*n-2 se rechaza la H0 (por lo tanto, β 1
valor con base en datos muestrales es:
es diferente de 0).

FÓRMULA

SY . X =
√ ∑ (Y −Y^ )2 = ∑ e2
n−2 √ n−2

Fórmula abreviada: Además, podemos calcular un intervalo de confianza


para la pendiente de la regresión β 1, del siguiente
SY . X =
√ ∑ Y 2−b0 ∑ Y −b1 ∑ XY
n−2
modo:

FÓRMULA INTERVALO DE CONFIANZA


El error estándar del estimador sirve de base para los
diversos errores estándar que se utilizan en los b 1 ± t n−2∗S b 1

procedimientos de prueba de hipótesis y de


RECTA DE AJUSTE QUE REPRESENTA LA
estimación por intervalos en el análisis de regresión.
ESTIMACION DE LA MEDIA CONDICIONADA

PRUEBA DE HIPOTESIS Y^ o ^
μY =b 0 +b1∗x
Antes de analizar la regresión entre dos valores
debemos saber si existe tal relación. Para ello usamos ERROR ESTANDAR DE LA MEDIA
la prueba de hipótesis. CONDICIONADA


2
En esta prueba, la hipótesis nula se define: H 0 : β 1=0 1 ( X−X )
SY X =S Y X∗ +
n
∑ X 2−[ (∑ X ) /n ]
2

Si dos variables no tienen relación, entonces se acepta


la H0 (pendiente = 0). Luego, el intervalo de confianza con n – 2 gl:
Se prueba el valor hipotético de una pendiente ^
μY ± t∗SY X
calculando la estadística t y utilizando n – 2 grados de
libertad. Se pierden dos grados de libertad en el
ERROR ESTANDAR DE LA PREDICCION
proceso de la inferencia porque se incluyen en el


análisis de regresión dos estimaciones de parámetros, 2
b0 y b1. 1 ( X−X )
SY pron ó stico =S YX∗ 1+ +
n
∑ X 2−[ (∑ X ) /n ]
2

FÓRMULA GENERAL
Luego, el intervalo de confianza con n – 2 gl:
b1−(β 1)0
t=
Sb 1
^
μY ± t∗SY pronóstico
SY . X
En donde Sb = ANALISIS DE CORRELACION
1

√ ∑ X −n∗X 2 2

19
ESTADÍSTICA Y PROBABILIDAD
El objetivo de este análisis es medir el grado de 2
r =b0
∑ Y + ¿ b1 ∑ XY −n Y
2
¿
relación o asociación entre las variables. Se centrará el
∑ Y 2−nY 2
análisis en la correlación simple.

SUPUESTOS GENERALES

1 La relación entre variables es lineal.


2 Las variables son aleatorias. COEFICIENTE DE CORRELACION
3 Para ambas variables, las varianzas condicionales
son iguales. Como el coeficiente de determinación está al
cuadrado, podemos usar la raíz cuadrada del r² para
4 Para cada variable, sus distribuciones son normales encontrar lo que llamamos coeficiente de correlación
de tipo bivariadas. r para diferentes pruebas estadísticas.
r varía entre -1 y +1 y el signo del coeficiente es el
COEFICIENTE DE DETERMINACION
signo asociado al signo de β₁ de la ecuación de
Es la principal forma en que podemos medir el grado, regresión.
o fuerza, de la asociación que existe entre dos
variables, X y Y. Esta asociación implica una relación FÓRMULA PARA POBALCIÓN
de causa y efecto. ρ=√ ρ2
El coeficiente de determinación muestral se deriva de
FÓRMULA PARA MUESTRA
la relación entre dos tipos de variación: la variación de
los valores Y en un conjunto de datos alrededor de la r =√ r 2
recta de regresión ajustada y su propia media. Fórmula alternativa sin calcular previamente valores
b0 y b1, para determinar el grado de relación de dos
El término variación en estos dos casos se utiliza en su variables cualquiera y sin calcular la recta de
sentido estadístico usual para expresar “la suma de regresión:
los cuadrados de un grupo de desviaciones”. n ∑ XY −∑ X ∑ Y
r=
El coeficiente de determinación ayuda a medir el
grado de proporción de varianza en la variable
√ n ∑ X −(∑ X) √ n ∑ Y −(∑ Y )
2 2 2 2

dependiente que queda explicada mediante esa UNIDAD 9: SERIES DE TIEMPO Y PRONÓSTICO
ecuación de regresión que ajustamos antes.
ANALISIS DE SERIES TEMPORALES
FÓRMULA PARA LA POBLACIÓN Es el procedimiento para identificar y separar los
2 patrones y tendencias relacionados con el tiempo que
2 σ XY
ρ =1− 2
están presentes en los valores observados de los
σY datos.
Una vez identificados estos factores, se puede
FÓRMULA PARA LA MUESTRA mejorar la interpretación de los valores históricos de
2
la serie de tiempo y se pueden realizar predicciones
2 S XY sobre el futuro.
r =1− 2
SY
COMPONENTES

FÓRMULACONVENIENTE PARA COEFICIENTE DE TENDENCIA (T)


DETERMINACIÓN MUESTRAL
Es el movimiento general a largo plazo de los valores
de la serie de tiempo (Y) sobre un extenso periodo de
tiempo. Se miden en años y algunas se mueven
20
ESTADÍSTICA Y PROBABILIDAD
continuamente hacia arriba. La técnica que se utiliza estos índices es un porcentaje, con un promedio anual
es la de mínimos cuadrados. Por ejemplo, las ventas a del 100%.
largo plazo, la oferta de empleo o los precios de
acciones. De esta forma, un índice estacional del 94% para
cierto mes, indica que las ventas en ese mes tan 6%
abajo del promedio anual; o un índice del 108,2%,
indica que las ventas de ese mes están 8,2% arriba del
promedio anual.

VARIACIONES IRREGULARES (I)

FLUCTUACIONES CICLICAS (C) Son variaciones erráticas respecto de la tendencia que


no pueden atribuirse a influencias cíclicas o
Son movimientos ascendentes y descendentes estacionales, y no se pueden predecir ni medir. No
recurrentes respecto a la tendencia con una duración existe ninguna técnica. Por ejemplo, guerras, huelgas
de varios años (periodos mayores a un año). También
o desastres naturales.
se mide en años y en periodos de prosperidad
seguidos de recesión, depresión y luego recuperación.
Se utiliza la técnica valores cíclicos relativos. Por MODELO CLASICO DE SERIES DE
ejemplo, el empleo, la producción o el precio de las TIEMPO
acciones.
Este modelo plantea una relación multiplicativa, válida
para cualquier período designado en la serie de
tiempo, el cuál define que el valor de una variable
está determinado por la siguiente fórmula:

FÓRMULA
MÉTODO: el componente cíclico puede identificarse Y =T ∗C∗E∗I
como el que persistiría en los datos luego de
eliminada la influencia del componente de tendencia. METODO DE SUAVIZACION EXPONENCIAL
Esta eliminación se realiza mediante:
Es un método de pronóstico basado en el análisis de
los componentes históricos de la serie de tiempo. Esta
FÓRMULA técnica utiliza un promedio móvil ponderado, en el
Y T∗C cual los pesos asignados se van reduciendo en forma
C= = ∗100 exponencial conforme mayor es la antigüedad de cada
YT T
período.
VARIACIONES ESTACIONALES (E)
SUAVIZACIÓN EXPONENCIAL SIMPLE:
Son movimientos ascendentes y descendentes
Y^ t +1=aY t +a ( 1−a ) Y t−1 +a ( 1−a ) Y t−2 +…+ a (1−a ) Y t −k
2 k
respecto de la tendencia que se consuman dentro de
un año y se repiten anualmente. Se identifican más en
Y^ t +1 = pronóstico para el siguiente período.
periodos trimestrales. Solo se aprecian si se tienen
datos trimestrales o mensuales. Los patrones de a = constante de suavización (0 ≤ a ≤1 ).
cambio son dentro de un mismo año, y dichos Y t = valor real para el período más reciente.
patrones se repiten cada año. Se utiliza la técnica Y t −1 = valor real para el período que precede al más
promedios móviles. Por ejemplo, ventas altas en reciente.
navidad y bajas después o consumos relacionados con
Y t −k = valor real para los k períodos precedentes al
las estaciones del año.
período más reciente.
MÉTODO: este análisis trata de identificar un número SUAVIZACION EXPONENCIAL SIMPLIFICADA
de índice estacional asociada a cada mes. Cada uno de

21
ESTADÍSTICA Y PROBABILIDAD
Dado que el procedimiento anterior es muy laborioso, ÍNDICES SIMPLES: Miden el cambio de una sola
en la práctica suele utilizarse una técnica simplificada variable. Por ejemplo, el precio de un solo producto.
que requiere de un pronóstico “semilla” inicial y evita ÍNDICES COMPUESTOS: Miden el cambio de un
grupo de variables.
determinar los pesos:
-Índices Agregados Simples: Suman los valores de las
variables y luego comparan.
SUAVIZACIÓN EXPONENCIAL SIMPLIFICADA:
-Índices Ponderados: Asignan una "importancia" o
Y^ t +1=Y^ t +a(Y t−Y^ t ) peso a cada variable dentro del grupo. Esto es
crucial cuando no todas las variables contribuyen
Como el valor más reciente de la serie debe estar por igual al fenómeno que queremos medir. Los más
disponible para pronosticar el siguiente, sólo puede conocidos son el Índice de Laspeyres y el Índice de
utilizarse la suavización exponencial para pronosticar Paasche.
el valor siguiente del período y no para diversos
períodos a futuro. Mientras más cercano a 1 se fije el
valor de la constante de suavización, más ponderado
estará el pronóstico con los resultados más recientes.
NUMEROS INDICES
Son herramientas fundamentales que nos permiten
medir y comparar cambios relativos en una variable o
un grupo de variables a lo largo del tiempo o entre
diferentes lugares.
COMPARACION RELATIVA
La clave de los números índices es que no nos
interesan los valores absolutos, sino su cambio
porcentual o proporcional respecto a un punto de
referencia. Este punto de referencia se conoce como
período base o base de comparación, y se le asigna un
valor de 100 (o 1, si se prefiere una escala decimal).
Todo lo demás se expresa en relación con esa base.

DONDE SE APLICAN?
Los números índices tienen una gran variedad de
aplicaciones prácticas:
-Medir la inflación/deflación: El Índice de Precios al
Consumidor (IPC) es el ejemplo más conocido,
indicando cuánto han cambiado los precios de una
canasta de bienes y servicios representativa.
-Analizar el crecimiento económico.
-Evaluar el poder adquisitivo.
-Comparar rendimientos.
-Estudios de productividad.

TIPOS DE NUMEROS INDICES

Podemos clasificar los números índices de diversas


formas, pero las principales son:

22

También podría gustarte