UCM
Estadística
Primer Cuatrimestre
Brenda
TEMA 1. INTRODUCCIÓN
El objeto de estudio de la estadística es el estudio de los fenómenos observables como:
- Fenómenos deterministas, definimos estos como aquellos que repetidos en
iguales condiciones proporcionan los mismos resultados.
- Fenómenos aleatorios: Son fenómenos que aun realizados siempre en las
mismas condiciones no proporcionan los mimos resultados. Por extensión son
los fenómenos de resultado incierto
FUENTES DE LA ALEATORIEDAD
Un fenómeno puede ser considerado aleatorio por tres motivos:
- Si hace referencia al futuro
- Información incompleta. La incertidumbre surge al no disponer de toda la
información, es decir, de todos los datos del fenómeno en estudio. Esto puede
ocurrir bien porque no se pueda acceder a los datos, bien porque sea muy
costoso recogerlos. En la mayoría de los fenómenos involucrados en las ciencias
sociales la incertidumbre está generada por este motivo, es por esto que estos
fenómenos se estudian a través de muestras
- Información defectuosa. Series históricas (datos que no se recogieron en su
momento, pérdida de datos…)
METODOLOGÍA ESTADÍSTICA
También la metodología estadística se refiere a la aplicación de procedimientos
estadísticos dentro de una población determinada. Una población con cualquier número
de elementos puede ser centro de observación
Esta metodología se forma a partir del problema que surge cuando recogemos cada
experiencia particular de un fenómeno aleatorio, el cual no nos proporciona ninguna
información, es por ello que es necesario analizar grupos numeroso de experiencias, es
decir analizar grandes masas de datos, lo que nos lleva a un recuento numérico.
CONCEPTOS FUNDAMENTALES
Población o universo: Es el conjunto de elementos, personas o cosas, que son objeto de
estudio.
Individuo: Es cada uno de los elementos de la población
Muestras: Se trata de un subconjunto de elementos representativos de la población.
FASES DEL ANALISIS ESTADÍSTICO
Estadística descriptiva: se encarga de representar, observar y analizar las características
de un grupo de datos que se pueden desarrollar a través de tablas, gráficos o valores
numéricos. En esta fase el objeto de estudio son suceso que ya han ocurrido. Es la fase
de analisis de datos.
Cálculo de probabilidades: El conjunto de técnicas matemáticas (modelo matemático)
que establecen el concepto de Probabilidad y los resultados que permiten manejarlo. En
esta fase el objetivo es el establecimiento del concepto de Probabilidad, que será
nuestra herramienta para manejar la incertidumbre, y la obtención de leyes
matemáticas que permitan utilizar el concepto. Es por tanto una fase deductiva
Inferencia estadística: Es el conjunto de técnicas que permiten
“inferir” o trasladar a la población completa los resultados
obtenidos para la muestra, así como el cálculo de la fiabilidad que
puede otorgarse a dichos resultados para la población. En esta Definiciones:
fase se pasa de lo particular, la muestra, a lo general, la
población. Es por tanto una fase inductiva La inferencia estadística
es el conjunto de métodos
EL PAPEL DE LA ESTADISTICA EN LA GESTION COMERCIAL
y técnicas que permiten
El comportamiento del hombre y la sociedad en su aspecto inducir, a partir de la
económico, son fenómenos por naturaleza aleatorios.
información empírica
proporcionada por una
muestra, cual es el
comportamiento de una
determinada población
con un riesgo de error
medible en términos de
Las técnicas estadísticas son necesarias para: probabilidad
- Obtener describir, analizar y presentar la información
adecuadamente
- Obtener conclusiones acerca de grandes poblaciones o
colectivos basadas solo en la información obtenida para
una muestra, es decir, en información parcial
- Hacer predicciones.
TEMA 2. LOS DATOS
Def. Los datos son los resultados observados de una cierta característica en estudio en
cada uno de los individuos que forman parte de la muestra. A esa característica la
llamamos VARIABLE.
TIPOS DE VARIABLES
Variables cualitativas: La característica del objeto de estudio no es susceptible a ser
medida.
Ej: ¿Cuál de estos deportes practica con asiduidad? Atletismo, tenis, baloncesto,
natación
A efectos del tratamiento de los datos y por comodidad, las distintas categorías de
respuesta de estas variables suelen codificarse en:
1.Atletismo 2. Tenis 3. Baloncesto 4.Natación 5.Otros
Dentro de la variable cualitativa tenemos:
-Variables de escala nominal: Los números son sólo identificadores de las distintas
categorías de respuesta y no podemos realizar ninguna operación con ellos. Podemos
distinguir dentro de estas la variable categórica (varias categorías de respuesta) y la
variable dicotómica (Dos categorías de respuesta)
-Variable de escala ordinal: el orden de
las variables es crítico. La diferencia entre
estas variables no está establecida y no es
en realidad un aspecto integral de esta
escala de medición
Variables cuantitativas: La característica objeto de estudio es susceptible de ser medida.
Edad, temperatura, ingresos. También se llaman variables métricas. Pueden a su vez
clasificarse en variables de intervalo y variables de razón. Las variables de intervalo son
aquéllas que carecen de un 0 absoluto que represente la ausencia total de la
característica que estamos estudiando, por ej. el coeficiente intelectual o la
temperatura. En las variables de razón el 0 representa la ausencia total: ingresos. En
ocasiones se confunde esta idea. No se trata de que la variable tenga o no el valor 0 para
clasificarla de una u otra forma, sino del significado que tiene este valor
ORGANIZACIÓN DE LOS DATOS: TABLA
Una vez recogidos los datos, para facilitar su interpretación y análisis es muy útil
organizarlos y resumirlos en tablas de frecuencias
Variable: X Es el dato con el que trabajamos.
Valores de la variable: x1, x2, x3…
Tamaño de la muestra: n
Frecuencia absoluta de un dato (n) es el número de veces que se repite en la muestra.
Frecuencia relativa de un dato (f) es el porcentaje de veces que se repite el dato en la
muestra
Si la variable toma muchos valores diferentes y que se repiten poco, es conveniente
agruparlos en clases o intervalos.
TEMA 3: DESCRIPCIÓN DE DATOS MEDIANTE MEDIDAS
DE RESUMEN
El objetivo del análisis descriptivo de datos es resumir la información contenida en la
muestra en unos pocos valores numéricos que sinteticen sus características. Estos
valores reciben el nombre de ESTADÍSTICOS.
Hay 4 tipos de estadísticos.
ESTADÍSTICOS DE TENDENCIA CENTRAL
Medidas centrales: Son aquellas que estudian el comportamiento de fenómenos
obtenidos de los valores en torno a los que se agrupan los datos. Nos informan de la
propensión del fenómeno estudiado a una cierta conducta. Los utilizamos como
“representantes” del conjunto de datos. Estos son:
▪ Promedios
− Media aritmética
− Geométrica y armónica
▪ Mediana
▪ Moda Medidas no centrales: los cuartiles
Media aritmética:
Es adecuada para resumir variable de escala métrica, es decir con valora cuantitativos.
Ventajas:
- Tienen en cuenta todos los valores de la variable
- Tienen significado claro y sencillo
- Es única para cada muestra
Inconvenientes:
- Esta muy afectada por la presencia de valores extremos. (valores atípicos que
pueden subir o bajar la media de forma drástica)
Mediana:
Es una medida de posición no un promedio. Supuestos los datos ordenados de menor a
mayor, la mediana es el valor que divide a la muestra en dos partes iguales. Es por tanto,
el valor con frecuencia acumulada : 2/n (tamaño de la muestra).
Es la medida de tendencia central adecuada para datos en escala ordinal, para las que
no tiene sentido el cálculo de promedios. Para conjuntos de datos numéricos con
valores atípicos o muy asimétricos puede ser mas representativa que la media
aritmética.
Ventajas:
- Es única para cada muestra
- No está afectada por los valores atípicos. Es decir que si hay algún valor atípico
el resultado de la mediana no se ve afectado por una subida o bajada drástica.
- No presenta problemas de cálculo
- Tiene un significado estadístico muy claro
Inconvenientes:
- No utiliza todos los datos de la muestra.
Moda:
Es el valor de la variable de mayor frecuencia. Es la medida de tendencia central
adecuada para datos en escala nominal. Las ventajas e inconvenientes son los mismos
que para la mediana, si bien puede NO ser única
Medidas no centrales: los cuartiles
Los cuantiles son los valores que dividen a la distribución en K partes iguales. Se calculan
de forma análoga a la Mediana sustituyendo n/2 por la frecuencia acumulada
correspondiente
ESTADÍSTICOS DE DISPERSIÓN
Medidas de dispersión: Indican la mayor o menor separación entre los valores de la
variable.
Recorrido o rango:
Nos informa sobre como se distribuyen los datos entre los extremos.
Recorrido intercuartílico
No depende de los valores extremos de la muestra no esta afectado por los valores
atípicos y mide el tamaño 50 % central de muestra.
Varianza
Tiene un significado estadístico muy claro: lo que se separan por término medio los
valores de la variable de la media. La media será tanto más representativa del colectivo
cuanto más se acerque a cero la varianza. En este caso diremos que la distribución es
muy homogénea o poco dispersa.
→Inconveniente: eleva al cuadrado la unidad de medida de la variable.
Soluciones: Desviación típica y coeficiente de variación de Pearson.
Sera más homogéneo cuanto menor sea su coeficiente de variación. Y cuanto mas
sea mas disperso es.
VARIABLE TIPIFICADA
Un individuo que gane 80000, la media es 35000 y la s(desvicion típica) = 5000
Dividimos 80000-35000/5000= 9 decimos que su salario esta a 9 unidades de la media.
Ya que 9 x5000 son 40000 que es lo que tiene el individuo de más por encima de la
media.
¿Para que sirve tipificar los valores? Es valor la posición relativa que tiene el sujeto
dentro del grupo. Si el valor tipificado es negativo es menor si gana un numero positivo
esta por encima de la media y si es 90 gana como la media.
¿Qué es la posición relativa? Es la posición que se ocupa con respecto al grupo.
ASIMETRÍA.
-Es distribución simétrica cuando la media es igual a la moda.
-Es asimetría positiva cuando su coeficiente de asimetría es positivo o cuando la media
es mayor que la mediana.
-Es asimetría negativa cuando su coeficiente de asimetría es negativo o cuando la media
menor que la mediana.
----EJERCICIO 7
Medidas de forma
solo tiene sentido estudiarla en variables de escala.
¿Cómo DETECTAR UN VALOR ATIPICO? S e recurre a un diagrama de caja
Pregunta: A partir de que valor un dato es atípico
ÍNDICE DE LORENZ cuanto más cerca este de 0 haz más igualdad el 0 es la máxima
igualdad, luego si el índice se acerca a 1 hay más desigualdad, 1 es la máxima
desigualdad.
Si en el índice de Lorenz la renta de x país pasa de 0,35 a 0,30, es decir que ahora esta
mas cerca del 0 el reparto de esa renta es mas equitativo y menos concentrado.
Hasta aquí el 75 % del primer examen parcial.
TEMA 4. NÚMEROS ÍNDICES Y SERIES CRONOLOGICAS.
Medida estadística sirve para comparar una magnitud generalmente económica en dos
situaciones o periodos de tiempo diferentes. Es por eso una medida de la variación
relativa de una magnitud.
La medida de una variación relativa supone fijar una situación de referencia,
denominada el PERIODO BASE.
TIPOS DE NUMEROS DE INDICES
Los números índices temporales (TIEMPO) , son aquellos que miden la variación
relativa de una magnitud entre dos periodos de tiempo.
Los números de índices espaciales (LUGAR) , estos miden la variación relativa de una
magnitud entre dos lugares geográficos o situaciones distintas, en un mismo tiempo.
TIPOS DE ÍNDICES: ÍNDICE SIMPLE Y ÍNDICE COMPUESTO
ÍNDICE SIMPLE de precios, es porque la magnitud económica que quieres comparar
es de precio, es simple cuando comparas la evolución de un solo bien.
INDICE COMPUESTO: evolución del precio de un conjunto de bienes. Se clasifican
en:
- Sin ponderar: Todas las magnitudes interviene en el índice con la misma
importancia.
- Ponderador: Cada magnitud interviene en el índice con una determinada
ponderación que refleja la importancia que le da el grupo humano que lo
consume. Ponderados son: Laspeyres, Paasche, Edgeworth Y Fisher
LASPEYERS Y PAASCHE
CAMBIO DE BASE Y ENLACE DE SERIES.
El cambio de base, se cambia el periódo base de una
serie si queda muy alejado o para realizar
determinados cálculos. El procedimiento es mediante
una regla de 3.
La serie adjunta tiene base en el año 2000. Se trata de
obtener la misma serie con base en 2009. Si 2009 es el
nuevo período base el índice debe tomar valor 100.
Con esta información se establece una proporción
para los valores de los restantes años:
ENLACE DE SERIES CON DIFERENTES PERIODOS BASE
Se tienen dos series diferentes con años consecutivos,
pero con diferentes periodos base. Se trata de obtener
una serie única.
TASA DE VARIACIÓN
DEFLACIÓN
DEFLACTAR: corregir el efecto de la inflación sobre las magnitudes económicas
expresadas en unidades monetarias
Las series de valores que están expresadas en valores monetarios están afectadas por
el efecto de los cambios que experimentan los precios (generalmente incrementos) a
lo largo del tiempo
Las alteraciones de los precios conllevan que las unidades monetarias de diferentes
períodos tengan distinto poder adquisitivo. En una situación de inflación (aumento
sostenido y generalizado de los precios) la capacidad de compra del dinero se reduce
de forma sostenida
SERIE TEMPORAL
Una serie temporal es la sucesión de las observaciones realizadas de una magnitud en
distintos momentos del tiempo.
OBJETIVO
− Estudio de la evolución de la magnitud en el tiempo
− Predicciones
COMPONENTES DE UNA SERIE TEMPORAL
TENDENCIA (T): Recoge la evolución del fenómeno a largo plazo: marcha general de la
magnitud. Tiene carácter sistemático y en general, una duración de varios años.
COMPONENTE CÍCLICA (C): Son los grandes movimientos más o menos periódicos de
período o amplitud muy largo y variable. Suelen deberse a etapas de prosperidad o
depresión económica. La amplitud de un ciclo es el número de años que dura el ciclo
completo. Cuanto mayor sea el período de un ciclo mayor ha de ser el número de
observaciones que realizamos de la magnitud para que éste sea reconocible.
COMPONENTE ESTACIONAL(E): Son los movimientos regulares y periódicos de período
fijo y corta duración (inferior al año natural). Se debe a factores generadores de
movimientos regulares como los factores climáticos.
VARIACIÓN ACCIDENTAL (A): Movimientos de carácter imprevisible como huelgas,
guerras, catástrofes naturales.
MÉTODO DE CÁLCULO DE LA TENDENCIA
− Método grafico
− Método de la media móvil
− Ajuste de una función
Método de la media móvil: Recoge una tendencia de una serie.
Las medias móviles, se obtiene la línea de tendencia sustituyendo progresivamente los
valores de la serie por promedios de un numero dijo de valores consecutivos.
Ventajas
• El cálculo es sencillo
• Es de fácil aplicación y manejo para no expertos
Inconvenientes
• Si el periodo de la media móvil es grande se pierden muchos datos
• No permite hacer pronósticos
VARIACION ESTACIONAL
Movimiento repetitivo y predecible alrededor de la línea de tendencia en un año o
menos.
Su objetivo es obtener un índice que describa, para cada mes, trimestre, día, etc, el
grado de estacionalidad. I.V.E. (Índice de Variación Estacional).
¿Qué indican los Índices de Variación Estacional? Indican el porcentaje de aumento o
disminución, con respecto a la tendencia, que se produce en los valores de la serie
observada por el hecho de estar en una determinada estación (mes, trimestre, etc..) El
índice está basado en una media de 100, y el grado de estacionalidad se mide por las
variaciones respecto a la base
DESESTACIONALIZAR
Proceso de eliminación de la variación estacional de la serie Se desestacionaliza la serie
dividiendo los valores originales por los I.V.E de cada periodo
TEMA 5 PROBABILIDAD.
CONCEPTOS BÁSICOS:
Fenómeno aleatorio: fenómenos de resultado incierto.
Probabilidad: Medida de la incertidumbre asociada a un fenómeno aleatorio.
Un fenómeno aleatorio son fenómenos de resultado incierto.
La probabilidad es una medida de la incertidumbre que es inherente y este asociado al fenómeno
aleatorio.
El espacio muestral es el conjunto de todos los posibles resultados de un experimento.
El suceso es un subconjunto del espacio muestral.
Ejemplo lanzar un dado el espacio muestral es 1,2,3,4,5,6
El subconjunto seria a- par (2,4,6) // b impar (1,3,5)
OPERACIONES CON SUCESOS
− Unión de sucesos P(A u B): Llamaremos unión de 2 sucesos, a otro suceso donde siempre ocurra
alguno de los dos, es decir siempre que ocurra Suceso A o Suceso B
− Intersección de sucesos P(A n B): Lo denomináramos al suceso donde ocurre Suceso A y Suceso
B al mismo tiempo.
Se dice que Suceso A y B son incompatible si su intersección es vacía es decir si nunca se juntan.
El suceso complementario (contrario) de un suceso, es el suceso que se produce cuando no ocurre
A.
Definición de LAPLACE.
Para este caso se necesita un espacio
muestral finito, no infinito.
Usamos la frecuencia relativa, para
determinar la probabilidad.
Def. Frecuentista: La probabilidad frecuencial o frecuentista hace referencia a la
definición de probabilidad entendida como el cociente entre el número de casos
favorables y el número de casos posibles, cuando el número de casos tiende a infinito.
- Una de sus limitaciones es que no siempre podemos garantizar que el
experimento se repita en condiciones iguales.
- La probabilidad siempre esta entre 0 y 1
- El cálculo es similar al enfoque de Laplace pero en este caso nos basamos en
datos observados, no en la estructura del proceso.
Def. Subjetiva: la probabilidad se determina con arreglo de dependencia que un sujeto
cree que va a ocurrir. Es decir, el grado de creencia que tiene uno sobre las posibilidades
que un hecho ocurra. Define y/x
Y es la apuesta y x el premio. Lo peor que puede hacer es no apostar nada cociente 0, lo
más que puede hacer es apostar igual a lo que va a recibir. Y no apuesta nada si no hay
premio.
Definición axiomática.
Las propiedades de las tres condiciones, la segunda acerca del conjunto vacío nos
habla de que la privacidad 0 es de conjunto vacío, pero aun así puede ocurrir.
Parte de propiedad conmutativa o asociativa _ No mirarlo.
REGLA DEL PRODUCTO
La regla del producto nos permite calcular la probabilidad de la intersección de dos
productos la regla del producto se convierte en el producto de las probabilidades, es
decir si.
P(b/a) p(a)= p(b)*p(a)
PROBABILIDAD CONDICIONADA
En algunas ocasiones se dispone de información acerca de un suceso que afecta al
cálculo de su probabilidad. El procedimiento que permite incorporar dicha información
adicional es la probabilidad condicionada.
PROBABILIDAD TOTAL Y DE BAYES. La probabilidad de que un cliente suscriba a
modalidad A es de 0,2 (20%). La probabilidad de B es 0,4 y del resto es decir de
modalidad C es de 0,4
Otro suceso rescatar el plan (suceso R) probabilidad 0,08; 0,05; 0,1 para las
modalidades A, B,C respectivamente.
Rescatar : P(R/A) = 0,08- P(R/B)= 0,05 – P(R/C)= 0,1
La probabilidad de rescate seria = p (R/A)* P(A) + p (R/B)* P( B) + p (R/C)* P(C)
36. Una empresa dedicada a la fabricación de automóviles desea lanzar al mercado un nuevo modelo el
año próximo. Al estudiar la posible situación que existirá en dicho año contempla tres alternativas que
son igualmente probables: inflación, estabilidad o depresión. La probabilidad de que se lance el nuevo
modelo es de 0.7 si existe inflación, 0.4 si existe estabilidad y 0.1 si existe depresión. ¿Cuál es la
probabilidad de que se lance el nuevo modelo al mercado el próximo año?
Si son igualmente probables P (I) = 1/3; P(E)= 1/3 ; P(D)= 1/3
L- Lanzar
La probabilidad es:
P (L/i)* P (i) + P (L/e)* P (e) + P (L/d)*P (d) =0,4
37. En un cierto grupo de inversores, 20 invierten en renta variable, 6 en renta fija y 4 en renta fija
internacional. Se conoce que el porcentaje de los que consiguen una rentabilidad media superior a la
media del mercado, es 90% en el primer grupo, 60% en el segundo y 40% en el último. Se pide:
a) RV= 20/30 ; RF= 6/30 ; RI =4/30
RENTABILIDA(RT)= P(RT/RV)= 0,9 ; P (RT/RF)= 0,6 ; P( RT/RI) = 0,4
P(RT/RV)= 0,9 * P(RV) + P (RT/RF)= 0,6 * P(RF) + P( RT/RI) = 0,4* P(RI)=0,77
b) P( RV/A) = P (RV∩A) / P (A) Aquí aplicamos la regla del producto
= P ( A/RV) * P (RV) /P (A)
Una empresa compra cierto tipo de piezas, las cuales son suministradas por 3 proveedores. El 35% de
las piezas se compran al primer proveedor y de ellas el 2% son defectuosas. El segundo proveedor
suministra el 40% de las piezas y de ellas son defectuosas el 3% . Las restantes piezas fueron
suministradas por el tercer proveedor siendo el 2% de las mismas defectuosas. En un control de
recepción de piezas se selecciona una pieza al azar y es defectuosa. Calcular la probabilidad de que
esta pieza haya sido suministrada por el segundo proveedor
Proveedor A = 0,35; Proveedor B= 0,4; Proveedor C = 0,25 ;DEFECTUSO- D
P(D/A)= 0,02 ; P (D/B) 0,03 ; P (D/C) 0,02
El calculo de la probalidad es
P (B/D) = P (BnD)/ P (D) = P (D/B) * P(B) / ( P (D/A)* P (A) + P (D/B)* P (B) + P (D/C)* P (C) )
(0,3*0,6)*0,25/0,25
0,8
Plazo = 0,75
Fuera plazo=0,25
P( e/p)=0,1
P(e/sp)=0,5
0,8
LA PROBALIDAD DE UN SUCESO
PA+ =PB- PAUB = 0,5
PUB = PA +PB - PA∩B (=0)
EJERCICIO TEOREMA DE BAYERS
A- Sin formación = 30% - P(P/A) = 0,4
B- Formación media= 60% - P(P/B) = 0,2
C- Formación superior= 10% - P(P/C) = 0,1
P – paro
P(P)= 0,4 * 0,3 + 0,2* 0,6 + 0,1* 0,1 = 0,25
1-0,25 = 0,75
P(AuB/P)=
P(C/P) = P(C∩P)/0,75 = P (P/C)*P(C) / 0,25 = 0,1 *0,1/0,25 = 0,04
1-0,04 = 0,96
P(C/P)= P(CnP) /0,75 = 0,9 * 0,1 / 0,75 = 0,12
TEMA 6. VARIABLE ALEATORIA.
VARIABLE ALEATORIA: Una VARIABLE ALEATORIA es una característica observable del
fenómeno objeto de estudio. (El resultado numérico de un experimento aleatorio) Los
datos son los resultados observados de una o varias variables aleatorias.
Clasificación de las variables aleatorias
- Categóricas: son las variables no numéricas (Nacionalidad de un turista que llega
a Barajas)
- Numéricas:
- Discretas : surgen de proceso de contar (“número de ……) Toman por tanto
valores aislados
- Continuas : surgen de proceso de medir. Pueden tomar cualquier valor
dentro de un intervalo
DISTRIBUCIÓN DE LA PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA.
Su distribución de probabilidad es la relación de valores que puede tomar y la
probabilidad de ocurrencia asociada a cada uno de los valores
¿cómo podemos determinar la distribución de probabilidad de una variable aleatoria?
Lo podemos determinar por sus características
Probabilidad aleatoria: características aleatorias que describen un suceso.
La distribución de frecuencias es lo que ha pasado y la distribución de probabilidades
es lo que esperamos que pase.
Las características principales son: es que tiene que estar entre 0 y 1 y que todas las
probabilidades sumen 1.
La función de cuantía es la que le asigna las probabilidades. Estudiamos la distribución
binomial y la distribución de Poisson.
Esperanza matemática. El resultado se denomina valor esperado.
P(X<3,5)=0,25+0,45+0,15
P(x</=2)= 0,7
P( X<2)=0,25
DISTRIBUCIÓN BINOMIAL.
Esta variable es el número de éxitos en n realizaciones particulares o ensayos.
En número de estos ponemos 7, en ensayos el número de veces que realizamos la
prueba (ej. 15) y probabilidad de éxito ponemos 0,5
Todo el ejemplo anterior se basa en el ejemplo de lanzar una moneda 15 veces.
LA DISTRIUCION BINOMIAL
Es la distribución de probabilidad que describe un fenómeno aleatorio con las siguientes
características:
- Cada realización particular del experimento sólo tiene dos resultados posibles,
los llamaremos éxito y fracaso.
- El resultado de cada realización particular es independiente de los demás.
- La probabilidad de obtener un éxito en una realización particular es constante.
- La variable aleatoria es el “número de éxitos en n realizaciones particulares o
ensayos”
LIMITES DE LA DISTRIBUCIÓN BINOMIAL
Probabilidad de éxito constante en cada prueba: Consideremos un proceso
industrial en el que sabemos que la probabilidad de que una máquina fabrique una
pieza defectuosa es 0.001 (1 de cada mil). Para utilizar la distribución Binomial como
modelo de probabilidad para la variable “nº de piezas defectuosas en 2500”
necesitaría poder suponer que la probabilidad de defecto es la misma en cada
prueba. Lo razonable es suponer que cada vez que la máquina produce una pieza se
da un desgaste infinitesimal que, si se acumula más allá de un punto razonable,
puede modificar la proporción de piezas defectuosas que hace la máquina.
Pruebas independientes: Una empresa de selección de personal tiene estimada en
0.2 la probabilidad de que un candidato pase la primera entrevista personal. No
podemos garantizar que el individuo que es entrevistado el último, tenga la misma
probabilidad que el primero.
DISTRIBUCIÓN DE POISSON
La distribución de probabilidad de Poisson se obtiene como una aproximación a la
distribución Binomial para n grande y p pequeño (n>20 y p <0,05). Por tanto la variable
aleatoria Poisson es “número de éxitos en n realizaciones particulares o ensayos”
VARIABLE ALEATORIA CONTINUA
Una variable aleatoria continua es aquélla que puede tomar cualquiera de los infinitos
valores de un intervalo. La distribución de probabilidad no puede describirse en forma
de “tabla o lista”, sino por medio de una curva que recibe el nombre de “función de
densidad
El área que crea el histograma por
debajo de las líneas que une las
distintas barras es el área
correspondiente a los intervalos de
amplitud. Siendo esta la función de
densidad.
Con gauss al calcular una probabilidad calculamos un área
Cuando es la distribución normal siempre en el apartado de acumulado de Excel
ponemos 1.
Ejemplo: p(7,2)
Buscamos P(7<X<7,5)
Para ello calculamos P (X<7,5) – P (X<7) = 0,5987 – 0,5 = 0,098
PARA PROBABILIDADE (X>250) podemos hacer:
- 1-P (X<250)
- P(X<-250)
P(67,15)
P(X<75)= 0,70
*La distribución uniforme no entra*
TEMA 7,8,9
Las componentes muestrales son variables aleatorias.
La media de una muestra es una variable aleatoria.
La tercera propiedad es que la media muestral es normal, lo establece el teorema central del limite.
La estimación puntual.
¿Cómo determinamos el marcan de erro? Aprovechando que la curva es normal.
• Alfa porcentaje si nos dice
99% ponemos 0,1
• Desv.: La que nos de
• Tamaño: Tamaño de la
muestra
Para modificar el margen de error sin varia alfa debemos modificar el tamaño de la
muestra ejemplo:
1,64*(2500/raíz de n)= 3000.
(1,64*25000/3000)^2= n --- n =186,77 (hay que redondear al entero mas próximo)
entonces la respuesta seria 187.
Habrá este tipo de preguntas en el examen donde se nos pida determinar n, variando
el porjentaje de confianza, margen de error que quiero o los dos juntos. En todos los
casos debemos despejar n.
PARTE DE INFERENCIA ESTATICA:
Definimos inferencia estática como el
proceso por el cual se utila la
información de una muestra para
extraer conclusiones sobre la
población.
La inferencia estática aborda el problema de estimación de parámetros desconocidos
de la población con tres metodologías:
- Estimacion puntual
- Estimacion por intervalo
- Contraste de hipótesis.
SELECCIÓN DE LOS ELEMTOS DE LA MUESTRA.
El muestreo lo definimoc ocmo el proceso mediante el cual se selecciona los elementos
de una muestra con el objetivo de representar la población.
- Muestreo aleatorio simple: Cuando cada elemento de la población tiene las
mismas probabilidades de ser elegido.
- Muestreo con remplazamiento o sin rremplazamiento:
El estadístico es un resumen de la información muestra es función de la muestra y por
tanto es una variables aleatoria.
Propiedades de la media muestral:
Teorema central del limite:
Estimación puntual Lo definimos como el proceso mediante el cual asignamos al parámetro
desconocido “media poblacional” un único valor: el que proporciona un estadístico, que
llamaremos estimador, para una muestra concreta
Limitaciones de la estimación puntual: No proporciona ninguna información acerca del error que
podemos cometer al estimar por este procedimiento.
El método de estimación por intervalos resuelve el problema. Este método proporciona la
probabilidad de error.
El método de estimación por intervalos no es tan preciso como la estimación puntual.
ESTIMACION POR INTERVALOS DE LA MEDIA DE UNA POBLACIÓN:
¿Cómo determinamos el margen de error?
Dependiendo de los distintos niveles de confianza del intervalo el margen de error
varia.
DETERMINACION DEL TAMAÑO DE LA MUESTRA (SUSTITUIR Y DESPEJAR N)
ESTIMACIÓN PUNTUAL
Para hallar la desviación típica hacemos: el valor de P Puede ser la estimacion exacto o el
valor del supuesto de maxima indeterminacion que es 0,5
TERORIA SOBRE SUCESOS TEMA 5.
- Si A y B son independientes, la probabilidad de que ocurra A, habiendo ocurrido
B, es igual a la probabilidad de que ocurra A, Verdadero
- Es falso el hecho de que si A y B son incompatibles, la probabilidad de que
ocurra A, habiendo ocurrido B, es igual a la probabilidad de que ocurra A. Ya
que al ser incompatible el hecho de que uno ocurra sobre otro es 0 ya que se
excluyen mutuamente.
- Si A y B son independientes, la probabilidad de que ocurran a la vez es el
producto de las probabilidades. Es verdadero.
1.El departamento de calidad de servicio de una franquicia de material informático está
diseñando una encuesta con el fin de determinar el nivel de satisfacción de los clientes
con el servicio postventa que ofrece.
Redacte las siguientes preguntas:
a. Dos preguntas que generen variables cualitativas nominales
b. Dos preguntas que generen variables cualitativas ordinales
c. Dos preguntas que generen variables de escala
SOLUCIONES:
a. ¿Cuál de estos materiales compra mas? 1. bolis 2. folios 3. Cuadernos
¿Compro en ultimo mes alguno de estos productos: bolis folios o cuadernos?
1. Si 2. No
b. Grado de satisfaccion con la calidad de nuestros productos.
Según el precio de nuestros productos como los considera: Caros Asequibles
Baratos.
c. Cuál ha sido la temperatura media de su ciudad en invierno.
Cuanto suele gastar en las rebajas de temporada?
2.Para un conjunto de empresas se dispone de información sobre las siguientes
variables:
a) Rama de actividad en la que opera
b) Nº de trabajadores
c) Forma jurídica de la empresa (sociedad anónima,
d) sociedad limitada)
e) Volumen de ventas
f) Si cotiza, o no, en bolsa
g) Cifra de beneficios
Clasificar las variables con arreglo a su nivel de medida y sugerir la representación gráfica
adecuada.
3.Determine si la afirmación es verdadera o falsa. Si es falsa, escríbalo como una
afirmación verdadera:
a. Los datos de escala nominal son únicamente cuantitativos
b. Para datos a nivel de ESCALA, usted no puede calcular las diferencias significativas
entre los datos de entrada
c. Más operaciones y cálculos se pueden realizar con datos a escala nominal que con
datos a escala numérica
SOLUCIÓN:
a. FALSO. Son los datos cualitativos los que son de escala nominal
b. Verdadera.
c. Falso. Se calculan más datos con aquellos de escala numérica que con los de
escala nominal.
4.Determine si los datos son cuantitativos o cualitativos
a. Los números de teléfono en un directorio telefónico
b. Las temperaturas diurnas mínimas para el mes de enero
c. Las calificaciones de una clase en el examen de estadística
d. El número de jugadores para un equipo de fútbol
SOLUCIÓN:
a. Cualitativo.
b. Cuantitativo
c. Cuantitativo
d. Cuantitativo
5.Supongamos que disponemos de la información proporcionada por 15 individuos a la
salida de un centro comercial:
a. Crear la hoja de cálculo
b. Tabla de frecuencias de cada variable
c. Representación gráfica de las variables nivel de satisfacción, sexo e importe de
la compra.
d. Obtener la medida de tendencia central que considere más adecuada para cada
variable.
e. ¿puede considerarse que el importe medio de la compra es representativo de
todo el colectivo entrevistado?
f. ¿Qué se gastan de media los individuos que dicen haber comprado productos de
marca blanca?, ¿y los que no? ¿Cuál de los dos valores es más
g. representativo?
h. ¿Cuánto debería haberse gastado un individuo para estar incluido dentro del
40% de los que más se gastan? ¿entre qué valores de gasto se encuentran el 30%
de los que menos gastan?
SOLUCIÓN
a)