0% encontró este documento útil (0 votos)
71 vistas34 páginas

Estadística: Conceptos y Aplicaciones

Este documento presenta conceptos básicos de estadística descriptiva e inferencial. Explica que la estadística es la ciencia que estudia la recolección, organización, análisis e interpretación de datos. Luego, describe las diferentes variables que se pueden medir y las distintas formas de organizar y presentar datos estadísticos, incluyendo tablas de frecuencias y distribución de frecuencias.

Cargado por

Nicoleee
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
71 vistas34 páginas

Estadística: Conceptos y Aplicaciones

Este documento presenta conceptos básicos de estadística descriptiva e inferencial. Explica que la estadística es la ciencia que estudia la recolección, organización, análisis e interpretación de datos. Luego, describe las diferentes variables que se pueden medir y las distintas formas de organizar y presentar datos estadísticos, incluyendo tablas de frecuencias y distribución de frecuencias.

Cargado por

Nicoleee
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Probabilidad

y estadística
descriptiva e
inferencial
¿Qué es la
estadística?
Campo de trabajo para el cual esta orientada la
asignatura en futuro del estudiante.-

Ciencias sociales y Económicas.- Polí<ca- Sociología

Ciencias Naturales : Física, Biología , Química.


Docencia – Inves<gación cienHfica.

Matemá<cas y Estadís<cas.- Docencia-


Inves<gación - Empresas de tangibles e intangibles
(seguros generales y de Vida)
Es la totalidad de Parte extraída de
individuos o una población por
elementos en los métodos que
permitan
cuales se presenta
S considerarla
una determinada
TO caracterís3ca.
como

EP representa7va de
C E S la misma.

O N AL
C ICI
IN

Cuantitativas

Cualitativas
• CATEGORIAS: Es el recorrido de la variable. Son todas las
respuestas observadas de una variable
• DATO: Corresponde a una característica observada en particular.
Si representamos por X a la variable, representamos por xi cada
dato diferente observado en la muestra

N° de ficha Sexo Edad Estado Civil Ingreso Tipo de inversiones


(miles de pesos)
00122 1 34 0 500 Exterior
00123 0 67 1 2.200 Mutuos
00124 0 46 0 860 Depósitos a plazo
DISCRETAS
(Sirve para contar)

CUANTITATIVAS
(CANTIDAD)
CONTINUAS
(Recorrido denso, es decir
no hay problema que existan
números intermedios entre
Clasificación de las enteros)
Variables
(Tipo de Medición)
NOMINALES
(No hay una elección mejor
que la otra)
CUALITATIVAS
(CUALIDAD)
ORDINALES
(Hay un orden de
importancia )
Ejercicio: Determine el tipo de variable en cada caso

Variable Tipo de Variable (Nivel de medición)


N° estudiantes
Género
Estatura (metros)
Notas obtenidas en matemáticas
Ciclo escolar (básica, media, universitaria)
U<liza lentes
% de aprobados en curso
Salario en Chile
Edad en años de los estudiantes del curso
Red social más usada por los estudiantes
TABLA DE FRECUENCIAS
Una tabla se requiere cuando el propósito es resumir la información de
cada variable de interés y sus categorías.
TABLA SIMPLE:
Nombre de la variable Tipo de frecuencia
Categoría de la variable Frecuencia observada

TABLA DE DISTRIBUCIÓN DE FRECUENCIA:


Variable Frec. Absoluta Frec. Frec. Frec. Frec. Frec.
Relativa Porcentual Absoluta Relativa Porcentual
acumulada acumulada acumulada
FRECUENCIA NOTACIÓN DEFINICIÓN

Frecuencia absoluta 𝒇𝒊 N° de observaciones de la categoría


p valor de xi
Frecuencia relativa 𝒇𝒊 Proporción de unidades de
𝒇𝒓 =
𝒏 observación que toman el valor o
categoría xi
Frecuencia porcentual 𝟏𝟎𝟎 & 𝒇𝒓 Proporción porcentual

Frecuencia absoluta 𝒋 Frecuencia acumulada de


acumulada 𝑭𝒋 = ( 𝒇𝒊 observaciones hasta el valor xj de la
𝒊$𝟏 variable
Frecuencia relativa 𝒋 Proporción de unidades de
acumulada 𝑭𝒓 = ( 𝒇𝒓 observaciones hasta el valor xj de la
𝒊$𝟏 variable
Frecuencia porcentual 𝟏𝟎𝟎 & 𝑭𝒋 Proporción porcentual acumulada
acumulada
Ejemplo:

Nota Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


(Xi) absoluta relativa porcentual absoluta relativa porcentual
acumulada acumulada acumulada
3 2 0,07 7% 2 0,07 7%

4 4 0,13 13% 6 0,20 20%

5 6 0,20 20% 12 0,40 40%

6 7 0,23 23% 19 0,63 63%

7 5 0,17 17% 24 0,8 80%

8 3 0,1 10% 27 0,9 90%

9 2 0,07 7% 29 0,97 97%

10 1 0,03 3% 30 1 100%

Total 30 1 100%
TABLA DE FRECUENCIA PARA DATOS AGRUPADOS

Para variables continuas o discretas


con muchas categorías distintas es Nombre de la variable Frecuencia
recomendable agrupar los datos en Li - Ls absoluta
intervalos o clases, de modo que cada
unidad de observación pueda ubicarse en [x1 – x2[ f1
uno de ellos. En estas tablas se gana [x2 – x3[ f1
manejabilidad, pero se pierde información,
por lo tanto, los resultados serán
aproximados.
[xk – xk+1] fk
Agrupar en intervalos de clase,
consiste en agrupar los datos en un número Total n
relativamente pequeño (5 a 15 app) los
cuales deben cumplir: 𝑥! = 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑒𝑥𝑡𝑟𝑒𝑚𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑢𝑛 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑜 𝑐𝑙𝑎𝑠𝑒
𝑥!"# = 𝑅𝑒𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑒𝑥𝑡𝑟𝑒𝑚𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑢𝑛 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑜 𝑐𝑙𝑎𝑠𝑒
a) No superponerse entre sí los datos, de
forma que no exista ambigüedad con
respecto al intervalo al que pertenece
b) Cubra todo el rango de valores que
tenemos en la muestra
TABLA DE FRECUENCIA PARA DATOS AGRUPADOS

• Marca de clase: Es el punto medio del


Nombre de la variable Frecuencia absoluta intervalo.
Li - Ls 𝑥"#$ + 𝑥"
𝑚! = 𝑥 =
[x1 – x2[ f1 2
• Número de intervalos o clase:
[x2 – x3[ f1
• 𝑛 < 50; 𝑘 = 𝑛
• 𝑛 ≥ 50; 𝑘 = 1 + 3,322 . ln(𝑛)
[xk – xk+1] fk • Rango:
𝑅 = max 𝑥 − min 𝑥
n
• Amplitud: (Distancia del Intervalo)
𝑎" = 𝑥"#$ − 𝑥"
• Construcción
𝑅𝑎𝑛𝑔𝑜
𝑎4 =
𝑁° 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
Ejercicio: La siguiente tabla representa la distribución de frecuencias de los
niveles de colesterol en la sangre en pacientes varones de entre 25 y 35 años.

Niveles de Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia 1. Complete la tabla


colesterol de clase absoluta absoluta relativa porcentual porcentual
(mg/100ml) acumulada acumulada
2. ¿Cuántos intervalos se observan?
3. ¿Cuál es el rango?
4. ¿Cuál es la amplitud?
[80-120[ 100 13 13 0,012 1,2% 1,2% 5. Se considera saludable tener
[120-160[ 140 150 163 0,141 14,1% 15,3% hasta 200 (mg/100ml) de
colesterol en sangre. ¿Cuántos
[160-200[ 180 442 605 0,414 41,4% 56,4% pacientes del estudio y en que %
[200-240[ 220 299 904 0,280 28,0% 84,7% se considerarían como una
población saludable?
[240-280[ 260 115 1019 0,108 10,8% 95,5%
[280-320[ 300 34 1053 0,032 3,2% 98,7%
[320-360[ 340 9 1062 0,008 0,8% 99,5%
[360-400] 380 5 1067 0,005 0,5% 100%
Total 1067
Ejercicio 1: Los siguientes datos corresponden a las estaturas, en
centímetros, de un grupo de atletas. Genera una tabla de frecuencias
para datos agrupados en cinco intervalos y luego responda.

1. ¿Qué porcentaje de los atletas tienen una estatura menor a 160


cm?
2. ¿Qué porcentaje del total de los atletas mide 170 cm o más?
3. ¿Cuántos atletas tienen una estatura entre 160 cm y 165 cm?
Ejercicio 2 : En la tabla se muestran las estaturas de los jugadores de basquetbol
que entrenan los días viernes en un gimnasio.
Estatura Mc f F
(cm)
[1,60-1,70[ 3
[1,70-1,80[
[1,80-1,90[ 1,85 8
[1,90-2,00[ 5 23
[2,00-2,10] 30
1. Completa la tabla con los datos que faltan
2. ¿Cuántos jugadores entrenan los días viernes en el gimnasio?
3. ¿En qué intervalo se concentra la mayor cantidad de jugadores?
4. ¿Cuál es la amplitud del intervalo?
5. ¿Cuál es el rango de los datos?
6. ¿Qué porcentaje del total de los jugadores tienen una estatura inferior a
2,00cm?
GRÁFICOS

Mediante el uso de gráficos es posible tener una impresión


mucho más clara del conjunto de datos. A través de los
gráficos se pueden llevar a cabo dos propósitos importantes:
• Comunicar y resumir la información disponible
• Analizar el conjunto de datos
Los gráficos cumplen la siguiente utilidad:
• Sirven para representar distribuciones de frecuencias
• Visualizar la existencia de asociación en una misma unidad de
observación
• Estudiar la homogeneidad de dos distribuciones
Características de los
gráficos
• Deben ser sencillos y autoexplicativos
• Deben cumplir un objetivo
• Deben considerar el recorrido de las
variables y nivel de medición
• Deben incluir un título
• Deben indicar mediante leyendas en ¿Qué es lo correcto en el gráfico?
los ejes los nombres de las variables
• Deben señalar las unidades de medida
si es que corresponde (escala, ¿Qué es lo incorrecto en el gráfico?
proporción)
• Deben indicar el tamaño de la muestra
Gráfico Circular
• Representación gráfica más usada
para variables nominales, también es
utilizada para variables ordinales o
para representar variables
cuantitativas sin agrupar.
• La frecuencia se relaciona a una
porción del círculo y cada ángulo del
centro esta dado por:

𝒇𝒊
𝜶𝒊 = % 𝟑𝟔𝟎°
𝒏
Gráfico de barras
• Cada categoría de la variable se
representa mediante una barra de
longitud igual a la frecuencia observada
en ese valor (absoluta, relativa o
porcentual)
• Es la representación grafica usual para
variables nominales u ordinales o para
variables cuantitativas sin agrupar.
• En el eje de las abscisas se representan
los valores o categorías de la variable
(x) y sobre cada valor levantamos una
barra de altura igual a la frecuencia
(absoluta o relativa)
Gráfico de barras

• Diferencias entre los gráficos


• ¿Cuál es el más conveniente?
• ¿Cómo se podría mejorar el gráfico?
Histograma
• Se usan para representar la distribución de
frecuencias de variables continuas o discretas
agrupadas.
• Son un conjunto de rectángulos adyacentes
levantados sobre los intervalos de clase y el área
es proporcional a la frecuencia o frecuencia
relativa de los intervalos.
• Si la amplitud de los intervalos son iguales, la
altura de estos rectángulos es equivalente a la
frecuencia o frecuencia relativa. Si las
amplitudes son diferentes, se utiliza la
frecuencia ajustada hi
𝑓&
ℎ& = &𝑘
𝑎&
fi : Frecuencia del intervalo
ai : amplitud del intervalo
k: Constante de proporcionalidad
Polígono de frecuencia

• Su objetivo es representar distribuciones de


frecuencias de una variable continua (o
discreta agrupada) cuando los intervalos de
clase tienen igual amplitud.
• Los puntos marcados en la gráfica
corresponden a la marca de clase (Mc) de
cada intervalo y su respectiva frecuencia.
• Son de gran utilidad si el objetivo es
comparar dos o mas distribuciones de
frecuencias en un mismo gráfico.
Diagrama de tallo

• Se utilizan para representar frecuencias de


variable cuantitativas y son sencillos de
construir.
• Ejemplo de tallo y hoja para la variable
edad, construcción: Separar cada valor en la
• El conjunto de hojas muestra la
componente tallo y hoja. distribución de los puntos muestrales.
• Tallo: Número formado por el valor de la • Es fácil identificar la mediana y el rango
observación menos el dígito de la derecha • Se puede evaluar simetría, dispersión,
• Hoja: Dígito de la derecha valores faltantes, situación especial de
algún valor y la concentración de datos
Creación e interpretación Diagrama de Cajón

Es una representación gráfica de un conjunto de datos cuantitativos


que busca entregar una visión rápida de cómo están distribuidos, en
particular, de una idea del grado de asimetría de estos y la posible
presencia de datos atípicos.
Otra utilidad de este diagrama es que sirve para comparar dos o
más grupos de datos. Además, el diagrama de caja muestra la
mediana; primer y tercer cuartil (por lo que se deduce el valor de
RIQ); el mínimo y máximo de los datos (por lo que deduce el valor
del rango).
RIQ: Recorrido intercuartil o rango intercuartil y corresponde al largo de la caja
y se calcula como Q3 – Q1 y representa la variabilidad de los datos con
respecto a la mediana (Me = Q2)
Para confeccionar un diagrama de cajón se necesitan los siguientes elementos:
mínimo, máximo, cuartil 1 (Q1), cuartil 2 (Q2), cuartil 3 (Q3), y una recta
graduada según los datos entregados.

Al observar un diagrama de cajón es posible obtener conclusiones respecto de


la distribución de la variable en estudio. Si uno de los cajones tiene mayor
área, quiere decir que los datos que se ubican entre determinados cuartiles
están más dispersos. Por lo tanto, lo primero que debemos conocer es como
calcular los cuartiles.
Ejercicio: En el Liceo X, las notas finales de la asignatura de matemática de los tres cuartos medios fueron las siguientes.
Construya los diagramas de caja correspondiente a cada curso (en un mismo gráfico).

Cuarto medio A Cuarto medio B Cuarto medio C


5,8 4,0 6,5 4,1 5,7 6,3 2,3 4,8 5,2 5,7 4,0 4,1 5,4 6,2 4,5 4,9 4,2 4,4 4,1 5,2 1,9
4,2 5,8 5,9 5,7 6,2 4,5 6,7 3,7 4,9 5,0 4,1 3,5 6,4 3,3 4,7 5,4 5,0 5,2 5,1 4,4 4,5
7,0 3,2 4,0 5,9 5,9 6,6 3,9 5,6 4,7 6,2 4,5 4,0 2,3 4,1 4,3 4,7 4,5 5,2 5,9 4,1 4,4,
4,0 4,2 4,1 6,4 4,5 4,3 6,6 3,6 4,8 5,7 5,9 5,1 5,5 6,1 5,2 3,7 4,8 4,9
4,3 4,0 5,1 4,5 6,3 5,1 5,3
4,9 5,4 3,3 4,4 3,9

También podría gustarte