0% encontró este documento útil (0 votos)
10 vistas25 páginas

Estadística Descriptiva

Cargado por

Katy
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • regla de Laplace,
  • técnicas de muestreo por conve…,
  • errores de muestreo,
  • valores atípicos,
  • variables cualitativas,
  • gráficos de caja,
  • interpretación de resultados,
  • inferencia estadística,
  • análisis de varianza,
  • independencia
0% encontró este documento útil (0 votos)
10 vistas25 páginas

Estadística Descriptiva

Cargado por

Katy
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • regla de Laplace,
  • técnicas de muestreo por conve…,
  • errores de muestreo,
  • valores atípicos,
  • variables cualitativas,
  • gráficos de caja,
  • interpretación de resultados,
  • inferencia estadística,
  • análisis de varianza,
  • independencia

ESTADÍSTICA DESCRIPTIVA

¿QUE ES LA ESTADISTICA?
La estadística es una rama de la matemática que se ocupa de la recolección, agrupación,
presentación, análisis e interpretación de datos
 Consiste en métodos, procedimientos y fórmulas que permiten recopilar la información con
el fin de realizar conclusiones sobre la misma.
 Una de las características fundamentales de la estadística es su transversalidad. Dado que
se utiliza en todas áreas y disciplinas
LA VAMOS A DIVIDIR EN DOS

¿QUÉ ES LA INFERENCIA ESTADÍSTICA?


 La inferencia estadística es un área de la estadística que persigue la obtención de
conclusiones de una población (PERSONAS U OBJETOS) a partir de una muestra aleatoria de la
misma (representa un porcentaje de la población), pretendiendo ir de lo particular a lo
general. (la inferencia expande los resultados de la muestra a la población lo que
suele tener un margen de error, que es parte de la estad. Inferencial medir ese
margen de error, ej: en las encuestas de candidatos daban el margen de error)
 Comprende los métodos que determinan propiedades de una población a partir de una
muestra.

VARIABLE ALEATORIA
Es una característica o cualidad que poseen los individuos de una población. (es algo que yo
voy a poder medir de forma cuantitativa (números) o cualitativa (descripción: alto,
bajo, colores) son características que me permiten medir de cual es la población
que yo quiero estudiar.)
 Esta característica o variable, puede fluctuar, es decir, su variación es susceptible
de adoptar diferentes valores, los cuales pueden medirse u observarse.
Ejemplo: a un mismo objeto o individuo podemos hacerle
LAS VARIABLES CUALITATIVAS: se refieren a características o cualidades que no pueden
ser medidas con números. Pueden se dicotómicas cuando solo pueden tomar dos valores
posibles o ser politómicas cuando pueden adquirir tres o mas variables.
Cada cualidad que se presenta se denomina atributo o categoría.
NOMINAL: las categorías no tienen un orden. Ej: el género, el estado civil, los colores.
ORDINAL: las categorías tienen un orden. Ej: el puesto en una competencia, medallas de una
prueba (oro, plata, bronce), el nivel de satisfacción de un servicio.
LAS VARIABLES CUANTITATIVAS: se expresan mediante números y por lo tanto son
factibles de realizar operaciones matemáticas con ellas.
DISCRETA: toman valores finitos entre dos valores. Es decir, la escala presenta separaciones
o interrupciones. Ej: la edad, la cantidad de hijos.
CONTINUA: toma infinitos valores entres dos valores cualesquiera. Es decir, no existen
interrupciones o separaciones entre los valores. Ej: el salario, el peso, la altura.
CUADRO Y GRÁFICO
 Los cuadros y gráficos estadísticos son los medios básicos para presentar los resultados de
los análisis de datos. (resumida)
 Son una herramienta útil y simple de construir, como así también fácil de comprender,
siempre que estén bien diseñados.

CUADRO
 Para diseñar cuadros y gráficos es necesario saber que es una frecuencia. Se define
frecuencia a la cantidad (valor absoluto) de veces que ocurre un suceso.
 Veamos un ejemplo. En el primer examen, 10 alumnos obtienen notas entre 1 y 5.
 A obtiene un 4, B un 2, C un 3, D un 4, E un 5, F un 5, G un 2, H un 4, I un 3 y J un 4.
frecuencia acumulada (Fi): es ir acumulando casos
frecuencia relativa (fi/N): la frecuencia fi se divide por 10N y lo multiplicamos por 100
obtenemos porcentajes.
Frecuencia relativa acumulada: dividir la frecuencia acumulada (Fi) /por N
Los intervalos deben ser todos iguales.

CLASE 2
Cuadro
 Veamos ahora el caso de datos agrupados.
 Este se usa cuando la cantidad de datos en grande y/o la variable es continua.
 También se utilizan estos criterios para realizar los histogramas (gráfico de barras) que
veremos posteriormente.
 Ejemplo. En el primer examen, 40 alumnos obtienen las siguientes calificaciones: 5 alumnos
obtienen 1, 2 alumnos obtienen 2, 2 alumnos obtienen 3, 5 alumnos obtienen 4, 3 alumnos
obtienen 5, 3 alumnos obtienen 6, 9 alumnos obtienen 7, 6 alumnos obtienen 8, 4 alumnos
obtienen 9 y 1 alumno obtiene 10.
 Si optamos por realizar un cuadro por cada unos de los valores de la variable, obtendríamos
que el mismo consta de 10 líneas. O podemos realizar una agrupación de datos y obtener un
cuadro con una menor cantidad de filas.
 Para ello, debemos definir los intervalos. Con el objetivo de que los mismos tengan la
misma amplitud.
A los intervalos también se les conoce como clases. Simplemente son las "categorías" en las
cuales vamos a encasillar a nuestros datos
es una variable:

cantidad de intervalos. Que denominares 𝑐.


 Para definir la amplitud de los intervalos tenemos que previamente definir la

 Una forma es mediante la intuición. En el ejemplo, para que los intervalos sean iguales en
amplitud parece conteniente c = 5
 Regla de Sturges: regla para cuando son continuas y una ayuda para cuando son discretas.

𝑐 = 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 ( 1 + 𝑙𝑜𝑔2 𝑁 )
El valor de c debe ser redondeado a un número entero. Es común redondearlo con el
siguiente criterio: si la parte entero del c es "par" se redondea a la alta y si es "impar" se
redondea a la baja. Resultando siempre un número impar de clases (lo que permite ver la
acumulación cerca de la media- concepto que veremos posteriormente-).

En nuestro ejemplo, 𝑐 = 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 (1 + 𝑙𝑜𝑔2 (40)) = 𝑟𝑒𝑑𝑜𝑛𝑑𝑒𝑎𝑟 6.3219 = 7


 Posteriormente, calculamos el rango de los datos

𝑟𝑎𝑛𝑔𝑜 = 𝑚𝑎𝑦𝑜𝑟 𝑣𝑎𝑙𝑜𝑟 − 𝑚𝑒𝑛𝑜𝑟 𝑣𝑎𝑙𝑜𝑟

En nuestro ejemplo, 𝑟𝑎𝑛𝑔𝑜 = 10 − 1 = 9

 Para definir la amplitud del intervalo hacemos: 𝑟𝑎𝑛𝑔𝑜/𝑐 (cantidad de intervalos que
quiero)

En nuestro ejemplo, 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 9/ 5= 1,8 (en el caso de variables discretas, conviene


redondear este valor, no siempre es exacto)

Se les suma la amplitud que es 1,8. El ultimo intervalo debe incluir la ultima nota, no se le
suma nada. Termina en 2 corchetes.

Agregamos la marca de clase:

Frecuencia relativa:
7%40=0.175 7%40=0.175
6%40=0.15
Frecuencia acumulada: 7%40=0.175. 14%40= 0.35

GRÁFICO
 Es una representación de los datos, generalmente cuantitativos, mediante recursos
visuales, para que se manifieste visualmente la relación matemática que subyace.
 Existe una gran cantidad de gráficos. Los que mejor suelen representar las relaciones
son los visualmente más sencillos.
 Dependiente del tipo de variable, es el tipo de gráfico que se pueden emplear
 Gráfico a ver durante la cursada:
 Histograma o gráfico de frecuencia
 Gráfico de barra
 Gráfico de torta
 Gráfico de dispersión
 Serie de tiempo (grafico de líneas)
 Gráfico de caja (Box –Plot) (después de ver medidas de dispersión)
GRÁFICO – GRÁFICO DE BARRA
 Un diagrama de barras, gráfico de barras o gráfico de columnas es una forma de
representar gráficamente un conjunto de datos o valores mediante barras
rectangulares de longitud proporcional a los valores representados.
 El gráfico de barras es una forma de resumir un conjunto de datos por categorías de
variable cualitativa y su frecuencia de aparición, una operación de una variable
cuantitiva (suma, promedio, otros), porcentaje, entre otros
 No existen reglas estrictas aplicables a los gráficos de barras, pero como normas
generales de presentación suelen ser las siguientes:
 El ancho de la barra debe ser uniforme para todas las barras del diagrama.
 La longitud de la barra debe ser proporcional a la cantidad que representa.
 El espacio de separación entre barras por cada categoría debe ser constante.
 Las barras en estos gráficos pueden disponerse vertical u horizontalmente.
CLASE 3. 08/09
MEDIDAS DE POSICIÓN Y DISPERSIÓN
 Cuando estamos frente a datos queremos tener una idea del “comportamiento” de los
mismos. Es decir, queremos poder comprender y ver qué información de interés podemos
revelar de ellos. Con este fin, existe cálculos (medidas) que representan características de los
datos.
 Las podemos agrupar en 4 categorías

Sumatoria x= es la suma del individuo uno al individuo N vamos sumando los valores de x/ N.
ej: si tengo 5 valores los sumo y los divido por 5.
Resultado del ejemplo: 60,5+61+60,7+59,9+60,5= 302,6/5= 60,52
¿Qué pasa si le agrego 150? Lo sumo y lo divido por 6. = 75,43
¿Qué paso con el promedio? El promedio se ve influenciado por valores grandes o pequeños.

La mediana es la suma de (60,5 + 60,7) /2= 60,6.


La mediana representa el valor de la variable.
¿Que paso con la mediana? No ve afectada por estos valores extremos.

Moda: es el que mayor frecuencia tiene (se repite)


Bimodal: dos modas
a los cuartiles
Clase 4 del 18/09 entra en examen
DEFINICIONES PREVIAS A PROBABILIDAD
E X P E R I M E N T O, E S PA C I O M U E S T R A L Y E V E N T O.
EXPERIMENTO: Antes de definir qué es la probabilidad y ver ejemplos de cómo calcularla,
enumeraremos algunas definiciones necesarias para comprender la misma.
Un experimento constituye un proceso con un resultado que no se puede predecir
certeramente con anterioridad.
El experimento debe poder repetirse, bajo las mismas condiciones, en el tiempo.
Ejemplo. Los experimentos más utilizados para explicar probabilidad, son:
1. Tirar una moneda y ver si se obtuvo “cara” o “cruz” (definiendo previamente cual lado de
la moneda cumple el rol de cara y cuál de cruz)
2. Tirar un dado (que no esté cargado) y ver cuál es el número del uno al seis que se obtuvo.
3. Extraer una bola de cierto color: 2 blancas, 3 azules. 2 rojas
ESPACIO MUESTRAL Se lo denomina 𝑆 es el conjunto de todos los posibles
resultados de un experimento
Al realizar un experimento debemos ser capaces de identificar todos los posibles resultados,
sean estos numéricos o no.
Ejemplo. `
1. El espacio muestral para el ejemplo de la moneda es S = { “cara”, “cruz” }.
2. Para el caso del dado, el espacio muestral para el ejemplo del dado es S = {1, 2, 3, 4, 5,
6}.
3. S= {b,b,a,a,a,r,r}

EVENTO o suceso
Si al realizar un experimento, solo interesan algunos de los posibles resultados del conjunto
entonces tenemos un subconjunto.
Un subconjunto de un espacio muestral se denomina evento.
Ejemplo.
Para lanzar la moneda: A= que caiga cara se escribiría A={c} aquí tiene un
elemento
Para el experimento tirar un dado, S = {1, 2, 3, 4, 5, 6}.
Si solamente queremos analizar el caso en el que resultado del dado es par tenemos el
subconjunto {2, 4, 6}. Aquí tenemos varios elementos.

ejemplo: Ejemplo. Un ingeniero eléctrico tiene en su mano dos cajas de resistencias, cada
una con cuatro de éstos. Las resistencias de la primera caja están etiquetadas con 10 Ω
(ohms), pero, de hecho, sus resistencias son de 9, 10, 11 y 12 Ω. Las resistencias de la
segunda caja tienen la etiqueta de 20 Ω, pero sus resistencias son de 18, 19,
20 y 21 Ω. El ingeniero elige una resistencia de cada caja y determina la resistencia de cada
uno.
¿Cuál es el espacio muestral?
• El conjunto de pares ordenados en el que el primer elemento representa la resistencia del
primer resistor y el segundo elemento constituye la del segundo resistor. (son todas las
posibles formas de sacar una resistencia de ambas cajas).
• S = {(9, 18), (9, 19), (9, 20), (9, 21), (10, 18), (10, 19), (10, 20), (10, 21), (11, 18), (11, 19),
(11, 20), (11, 21), (12, 18), (12, 19), (12, 20), (12, 21)
Ejemplo:
Sea A el evento para el cual el primer resistor tiene una resistencia mayor a 10.
Sea B el evento en el que el segundo resistor tiene una resistencia menor a 19
Sea C el evento en el cual la suma de las resistencias es igual a 28.
Especifique los subconjuntos que corresponden a los eventos A, B y C.
Los eventos A, B y C están dados por
• A = {(11, 18), (11, 19), (11, 20), (11, 21), (12, 18), (12, 19), (12, 20), (12, 21)} nos
ubicamos solamente a partir de mayor de 10
• B = {(9, 18), (10, 18), (11, 18), (12, 18)}
• C = {(9, 19), (10, 18)
CONJUNTO
Es usual emplear la notación de conjuntos para describir los eventos de un espacio
muestral.

*los que se escribieron en A no se repiten. En B.


PROBABILIDAD: regla de laplace
Definición clásica: Dado un experimento o fenómeno aleatorio, con espacio muestral 𝑆 y un
evento 𝐴 de este espacio muestral. Se llama probabilidad de que ocurra el suceso 𝐴 al
cociente entre el número de puntos muestrales en 𝐴 (resultados favorables) y el total de
puntos muestrales en 𝑆 (resultados posibles). Sin embargo, esta definición es válida
solamente en el caso de que todos los puntos muestrales sean equiprobables.

𝑃 (𝐴) =𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠/ 𝐶𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠


Ejemplo las resistencias: #s=16(casos posibles).
Ahora tengo el evento donde la suma de las dos resistencias daba 28que estaba formado por
9 y 19, 10 y 18. Entonces cual es el cardenal de A? la cantidad de elementos que tiene el
conjunto (cantidad de casos posibles). Tengo dos elementos, entonces el cardenal de A es 2,
esto es lo que se llama casos favorables.
A=+28---------
A={(9,19),(10,18)}
#A=2
P(+28))= 2/16
Entonces si quiero calcular la probabilidad de que la suma de las dos resistencias de 28 es 2
sobre 16 (porque el conjunto A que formaba la suma es de 28, esta formada por 2 y el
conjunto de casos posibles que es de 16 elementos.
Estamos asumiendo que todos los elementos de s tienen la posibilidad de salir y eso se llama
que hay probables, aplicando la definición clásica que hay casos favorables sobre casos
posibles.
Probabilidad
Ejemplo 1. Tiro una moneda. ¿Cuál es la probabilidad de que salga “Cara”?
• Espacio muestral

• 𝑆 = (𝑐𝑎𝑟𝑎, 𝑐𝑟𝑢𝑧)
• ¿Cuáles son los casos posibles?
• 2, cara y cruz
• ¿Cuáles son los casos favorables?
• 1, solo la cara

Solución. 𝑃 (cara) =
1
2
Ejemplo 2. Tiro un dado. ¿Cuál es la probabilidad de que sea par el resultado?
• Espacio muestral

• 𝑆 = 1, 2, 3, 4, 5, 6
• ¿Cuáles son los casos posibles?
• 6, todas las caras del dado
• ¿Cuáles son los casos favorables?
• 3, solo las caras por

Solución. 𝑃 (par) = ( = )
3 1
6 2

Probabilidad
La definición axiomática de la probabilidad es quizás la más simple de todas las
definiciones y la menos controvertida. Está basada en un conjunto de axiomas (afirmaciones
que se acuerdan y no se prueban).

Supone la existencia de una función de probabilidad 𝑃 que asigna un número real a cada
suceso 𝐴 definido en el espacio muestral s.
Axioma de probabilidad (debe cumplir estos 3 puntos)

1. Sea 𝑆 un espacio muestral. Entonces 𝑃 (𝑆)= 1.

2. Para cualquier evento 𝐴, 0 ≤ 𝑃(𝐴) ≤ 1 (tiene que valer entre 0 y 1)

3. Si 𝐴 y 𝐵 son eventos mutuamente excluyentes, entonces 𝑃 (𝐴 ∪ 𝐵) = 𝑃 (𝐴) + 𝑃 (𝐵)


Notar que la definición clásica de probabilidad cumple el axioma de probabilidad.
Ejemplo de las pelotas 4r y 6ª. Tengo la probabilidad (p): de que asigne rojo a 0,4 y azul a 0,6.
Donde (S) es solamente = {rojo, azul}. Entonces esta es mi función de probabilidad. Tiene
solo 2 posibilidades a rojo lo manda a 0,4 y azul a 0,6. Cuáles son los eventos posibles que
tengo? Rojo es un evento y azul es un evento. La probabilidad de rojo tiene que estar entre 0
y 1, cumple porque vale 04, la probabilidad de azul tiene que estar entre 0 y 1, cumple
porque vale 0,6. Rojo y azul son mutuamente excluyentes la pelota sale roja o sale azul no
sale violeta ósea pasa una de las dos. Entonces la probabilidad de rojo o azul es 1-p (rojo o
azul) =p(rojo)0,4+p(azul)0,6= 1 se cumple
Probabilidad: consecuencia- axioma de probabilidad

De forma más general, si 𝐴1, 𝐴2, … … son eventos mutuamente excluyentes, entonces

𝑃 (𝐴1 ∪ 𝐴2 ∪ ⋯.) = 𝑃 (𝐴1) + 𝑃 (𝐴2) +….


Además de los axiomas podemos deducir dos reglas:

I. Sea 𝐴 un evento, entonces 𝑃 (𝐴𝑐) = 1 − 𝑃(𝐴).

II. Sea 𝐴 = ∅, entonces 𝑃 𝐴 = 0.

probabilidad. (cumple que: 1. P(s) =1, 2. P(A)=0 ≤ 𝑃(𝐴) ≤ 1, 3. 𝑃 (𝐴 ∪ 𝐵) = 𝑃 (𝐴) + 𝑃 (𝐵) es decir son
S= {amarillo,rojo, azul} P: Amarillo 0,1 Rojo0,25 Azul0,4. } sumados cumplen con el axioma de

mutuamente excluyentes.

Cumplen con las consecuencias: 4. P (A1UA2…) =P(A) + P(A2), 5. P(Ac) 6. P (A)= 0


Afuerano sabemos

¿La probabilidad de que acierte en el tablero? Amarillo rojo y azul tienen la particularidad de ser mutuamente
excluyentes.

La probabilidad de que pegue fuera del tablero es de 0,25, porque 1-0,75


1. 15/150 o 10%de alumnos.
2. 55+15/150= 70/150
3. 1
5
+
2
0
+
1
0
/
1
5
0
=

45/150
1ra regla

2da regla.

Otra regla.

Probabilidad de b es
15/105(si tengo tabla
hago esta)
P(a)=p(aՈb)/p(a)
P(b)=p(aՈb)/p(b)

INDEPENDENCIA: algunas veces el conocimiento de que un evento a ocurrido no


cambia la probabilidad de que ocurra otro. En este caso las probabilidades condicional e
incondicional son las mismas y se dice que los eventos son independientes.
Ej.: ¿cuál es la probabilidad de consumir caramelos? Suma la columna 1=30
Propiedad incondicional(consumir caramelo) = 30/150=0,2
¿y la de consumir caramelos dado que soy mayor a 50 años?

Propiedad condicional→ P (consumen caramelo/mayor a 50) =10/50= 0,2

*tomamos 10, por que hay un condicional Mayor a 50.


*podemos decir que la propiedad condicional e incondicional dan el mismo valor,
decimos la probabilidad (mayor a 50/caramelo)= probabilidad(mayor a 50)
(condicional =incondicional) si se cumplen los 2 eventos decimos que son
mutuamente independientes

Definición:

El Word es el machete que podemos tener en el examen.


Si a y b son independientes la intersección se calcula como el producto de las probabilidades
individuales.
Ejemplo: una prueba para detectar la presencia de una enfermedad, da resultado positivo en
un individuo enfermo con probabilidad 0,99 y en uno sano con 0,02.
se sabe además que el 10% de la población tiene la enfermedad.
¿Cuál es la probabilidad de estar enfermo y que el test sea positivo’
¿Qué datos sabemos?
Desarrollo: E=enferma. S=sana. (estar enfermo y sano seria complemento)
La probabilidad P(E)es 10%=0,1
P(sano)=0,9
P(positivo/enfermo)=0,99
P(S) =1- p( E )
=1 – 0,1= 0,99
1. Probabilidad de que de +/ y este enfermo. P(+ E)= 0,99 esto es una condiion:
condicional, porque ya se que la persona esta enferma se hace el test y le da positivo.
2. La siguiente condición es la probabilidad de que de positivo, sabiendo que esta sano:
P(+/sano) = 0,02.
De 1 y 2 podemos sacar complementos
1. P(+/E) =0,99 P(-/E) = es el complemento del positivo cuando está enfermo =0,01
2. P(+/sano) =0,02P(-/s) =0,98

Sería una intersección P(E Ո +) como lo calculamos? = P(+/E)*P(E ) o,1*0,99= 0,099 o


P(E/+)*P(+)estas no la conocemos.
interseccion unión.

Cuando no hay elementos en común se llaman: mutuamente excluyentes.


¿Si tengo probabilidad de uniones como los calculo?: sumando la probabilidad individual de
cada uno. ↓

¿Como calculamos una intersección? Multiplicando la probabilidad de enfermos por la


condicional: P(A1) *p(B/A1) + P(A2) *P(B/A2) +……
Ejemplo: clientes que compran cierta marca de automóvil pueden pedir un motor en
cualquiera de tres tamaños. De todos los automóviles vendidos. 45% tiene el motor mas
pequeño, 35% tamaño mediano y 20% mas grande. Los automóviles en una prueba de
emisiones dentro de los 2 años de su compra fallan 10% con el motor mas pequeño, mientras
que el 12%de los tamaños medianos y 15% de los de motor mas grande. ¿Cuál es la
probabilidad de que un automóvil elegido aleatoriamente pueda fallar en una prueba de
emisiones dentro de los primeros años??
P(pequeño)=0,45 P(falle/pequeño) =0,1
P(mediano)=0,35 P(falle/mediano) =0,12
P(grande)=0,2 P(falle/grande) =0,15
Lo representamos como diagrama de árbol. Nos interesa las ramas de falla, multiplicamos
esas ramas.
P (motor falle) = P(pequeño)*P(falle/pequeño) + P(mediano)* P(falle/mediano)
+P(grande)*(falle/grande) =
=0,45*0,1+0,35*0,12+0,2*0,15=0,117

Eje: P(pequeño/falle) = P(pequeño)*P(F/pequeño) = 0,45*0,1 = 5


P(falle) 0,45*0,1+0,35*0,12+0,2*0,15 13

También podría gustarte