0% encontró este documento útil (0 votos)
27 vistas11 páginas

Introducción a la Estadística Descriptiva

Aaaaqqqq

Cargado por

maslupamina
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
27 vistas11 páginas

Introducción a la Estadística Descriptiva

Aaaaqqqq

Cargado por

maslupamina
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIDAD 1: ESTADÍSTICA DESCRIPTIVA

INFERENCIA ESTADÍSTICA

La estadística descriptiva se ocupa de la recolección, el análisis y la interpretación de datos. Los datos corresponden a
cierta características de una población, que es el conjunto de individuos que estamos investigando y que no
necesariamente son personas (pueden ser animales, plantas u objetos).

Cuando la población es finita y pequeña, en general conocemos los valores de las variables para todos los individuos.
Cuando la población es muy grande (o incluso infinita), trabajamos con una muestra, es decir con los datos de algunos
de los miembros de la población. Al elegir una muestra debemos fijarnos que sea representativa de la población
correspondiente.

Llamamos variable es una característica, propiedad o atributo. Estas pueden ser variables cualitativas y cuantitativas.
Dentro de las variables cuantitativas están las continuas (altura1,63), y las discretas (1 persona).

Cuando se recopilan muchos datos, puede ser que algunos se repitan. Se llama frecuencia a la cantidad de veces que
se repite un determinado valor de la variable.

La frecuencia relativa es qué parte del total representa cada valor de la variable. Si se multiplica la frecuencia relativa
por 100, se obtiene la frecuencia porcentual.

Muchas veces interesa conocer cuántos datos se acumulan hasta cierto valor, para lo cual, habrá que sumar, a la
frecuencia de ese valor, la frecuencia de los valores anteriores. A esta suma parcial se la llama frecuencia acumulada.

La estadística se ocupa de trabajar con datos:

1. Recolectarlos: por ejemplo, al hacer una encuesta.


2. Organizarlos: La organización varía según el tipo de datos recolectados que pueden ser cualitativos, como el
sexo o la nacionalidad; o cuantitativos, cuando indican cantidad. En este caso también pueden ser discretos
(el número de veces que sale cara al tirar una moneda) o continuos (la altura de un grupo de individuos).
Cuando los datos son cuantitativos, la manera más común de organizarlos es ordenarlos. Cuando los datos
son continuos, en general se los agrupa en clase (entre dos valores posibles)
3. Representarlos en tablas, diagramas o gráficos
4. Analizarlos y calcular sus parámetros de posición (media, mediana y moda) y de dispersión (desviación
típica, varianza)

La otra parte de la Estadística se llama inferencial, y tiene que ver con toma de decisiones y con anticipar situaciones.
Hacemos una inferencia cuando a partir de ciertos datos sobre una muestra, extraemos conclusiones que
consideramos válidas para toda la población, y que luego avalan una toma de decisión. Por ejemplo cuando concluimos
que un medicamento es efectivo, a partir de analizar los resultados de una prueba en la que se lo administró a un
grupo reducido. Decidimos entonces ponerlo a la venta.

Cuando a partir del análisis del comportamiento actual prevemos el comportamiento futuro de una población,
también estamos infiriendo. Este tipo de inferencia se utiliza en las mediciones de tendencia; por ejemplo, del
resultado de una elección.

Parámetros estadísticos: Sirven para recabar más información que los gráficos y tablas. La razón de los parámetros
estadísticos es la de resumir en un número un aspecto relevante de la distribución que pueda dar una idea de la
misma y compararla en ese aspecto con otra.

Analicemos algunas cuestiones de la estadística descriptiva:


Ejemplo: Arrojamos 100 veces un dado y contamos las veces que sale cada número

Esta información la podemos representar en una tabla de frecuencias, un diagrama de barras, en un diagrama
circular

Tabla de frecuencias

Número 1 2 3 4 5 6
Frecuencia 11 14 18 25 19 13

Diagrama de barras

Frecuencia
30
25
20
15
Frecuencia
10
5
0
1 2 3 4 5 6

Gráfico circular o de torta

Frecuencia
1
13 11
2
14 3
19
4
18
5
25
6

Medidas de tendencia central

La media de un conjunto de datos cuantitativos es el promedio aritmético, es decir, la suma de los valores dividido
por el número de valores

𝑠𝑢𝑚𝑎 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠
X = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

Cuando tenemos muchos datos es conveniente organizarlos de la siguiente manera:


Número (x) Frecuencia (f) Frec. X*f
Acumulada
1 11 11 11
2 14 25 28
3 18 43 54
4 25 68 100
5 19 87 95
6 13 100 78
∑ = 100 ∑= 100 ∑ = 366

∑𝑥.𝑓 366
Entonces: x = ∑𝑥 = 100 = 3,66 ∑ en matemática significa sumatoria

La moda de un conjunto de valores es el valor que aparece con mayor frecuencia. Puede que haya más de una
moda. En el ejemplo la moda es 4.

La mediana de un conjunto de datos cuantitativos ordenados, es el valor central, el que tiene la misma cantidad de
valores por debajo que por encima. Si tenemos un valor impar de valores es directamente es del medio. Si tenemos
un número par de valores, es el promedio de los dos centrales. En el ejemplo 50 y 51, que en ambos casos son 4, de
modo que la mediana es 4.

Comparación de la media y la mediana

Calcular la media y la mediana saber cómo es la distribución de los datos analizados.

En general la distribución de datos se interpreta de tres maneras:

• Si la media y la mediana son iguales, se dice que la distribución es simétrica y no tiene sesgo.
• Si la media es menor que la mediana, y los datos están cargados a la derecha, la distribución tiene un sesgo
negativo.
• Si la media es mayor que la mediana y la mayoría de los datos están a la izquierda, la distribución tiene sesgo
positivo.

Datos agrupados

Intervalos de clase: Los intervalos se usan cuando la variable es cuantitativa continua o cuando los datos son muy
numerosos. Llamamos amplitud o longitud del intervalo, a la diferencia ente el extremo inferior del intervalo y el
extremo inferior del intervalo siguiente. Llamamos recorrido a la diferencia entre el valor mayor y menor. Es decir la
longitud del tramo en el que están los valores de la variable.

Si los datos estuvieran agrupados, considerando los precios de alquiler de departamentos en la zona céntrica de la
ciudad de Bs. As.

Alquiler 700-900 900-1100 1100-1300 1300-1500 1500-1700 1700-1900


Frecuencia 20 80 140 170 70 23

En este caso para calcular la media, tomamos como valor correspondiente a cada intervalo su punto medio, llamado
marca de clase
Alquiler X (marca de F (ferecuencia) X*f
clase)
[700-900) 800 20 16000
[900-1100) 1000 80 80000
[1100-1300) 1200 140 168000
[1300-1500) 1400 170 238000
[1500-1700) 1600 70 112000
[1700-1900) 1800 23 41400
∑ = ___ ∑ = 655400

655400
X= 503
= 1302,98 Significa que el promedio del precio de los departamentos es de $ 1300

La moda se encuentra en el intervalo (1300-1500)

La mediana se obtiene
𝑛
−𝐹
Me =li + 2 𝑓𝑖 . 𝑎

Donde: li= límite inferior

F i-1 = frecuencia acumulada hasta el intervalo anterior al que contiene a la mediana

F= frecuencia simple del intervalo que contiene la mediana

A= amplitud del intervalo que contiene a la mediana

N= El total de datos

¿Cómo obtener la cantidad de intervalos, amplitud?

Regla: La raíz cuadrada del número de observaciones a menudo funciona bien, o log 2 (n+1); se puede obtener como:
log(𝑛+1)
log2 (n+1) = , o a fórmula de Sturges: C = 1 + 3,322 (log n)
log 2

Una vez establecido el número de intervalos de clases que se usarán, la amplitud de clases se encuentra usando el
rango (R), que es la diferencia entre la medida mayor y la medida menor.

Como K clases debe cubrir el rango, dividimos éste entre el número de clases para encontrar la amplitud de clases,
𝑟𝑎𝑛𝑔𝑜
es decir, la amplitud = 𝑛º 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠

Medidas de dispersión
Junto con las medidas de centralización (media, mediana y moda), para describir un conjunto de datos tenemos las
medidas de dispersión, que nos dicen algo sobre cómo están distribuidos los valores alrededor de la media.

Los parámetros más usados son el rango, que es la diferencia entre el mayor y el menor valor, y la desviación típica
o estándar que se calcula para un conjunto de N datos xi y media x como:

∑(𝑥𝑖 − 𝑥)2
𝛿= √
𝑛

Cuanto menor es la desviación típica, más cerca están los datos de la media. La varianza (δ2) es el promedio de los
cuadrados de las desviaciones, su raíz cuadrada es la desviación típica o estándar.

∑(𝑥𝑖 − 𝑥)2
𝛿2 =
∑ 𝑓𝑖

En muchos libros, podemos encontrar esta fórmula con N-1 en el denominador, en lugar de N. En realidad, si
trabajamos con muestras de población, la fórmula debería usarse con N-1.

Siguiendo en ejemplo, deberíamos agregar unas columnas

Número (x) Frecuencia (f) Frec. X*f (x-x)2


Acumulada
1 11 11 11 (1-3,66)2
2 14 25 28 (2-3,66)2
3 18 43 54
4 25 68 100
5 19 87 95
6 13 11 78
∑ = 100 ∑= 100 ∑ = 366
Recordamos que la x = 3,66

Obtenga la varianza y desviación típica

Para datos agrupados las fórmulas son:

∑(𝑥𝑖 − 𝑥)2 . 𝑓𝑖
𝛿= √
𝑛

∑(𝑥𝑖 − 𝑥)2 . 𝑓𝑖
𝛿2 =
∑ 𝑓𝑖
Coeficiente de variación

Es un porcentaje que me indica si la distribución es homogénea o no. Si el coeficiente de variación es mayor al 30%
la distribución no es homogénea. Si es menor al 30% la distribución es homogénea. Su fórmula es:

𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎 𝛿
c.v. = . 100 es decir, c.v. =𝑥. 100
𝑚𝑒𝑑𝑖𝑎

Para una distribución normal, como lo son las mayorías en la naturaleza, aproximadamente el 70% de la población
está en el intervalo (x-δ; x+𝛿), el 95 % en el intervalo ( x-2δ; x+2δ) y el 99% en el intervalo (x-3δ; x+3δ)

Otra medida de dispersión que a veces se usa es la desviación media, que es el promedio de los valores o módulos
de los errores.

La raíz cuadrada de la varianza se llama desvío típico.

Cuanto mayor es la desviación típica, más dispersos están los datos respecto de la media
ESTADÍSTICA

TRABAJO PRÁCTICO N°1

1) Explique con sus palabras de qué se encarga la estadística descriptiva


2) ¿Qué es una variable?. ¿En estadista con que tipos de variables podemos trabajar?
3) Diferencie población y muestra
4) ¿A qué se llama frecuencia?
5) ¿Qué es un parámetro estadístico?
6) Leer detenidamente el ejemplo del apunte (el de los dados)
7) ¿Qué debemos tener en cuenta a la hora de armar un gráfico estadístico?
8) Explique que es la media, la moda y mediana.
9) De un curso se obtuvieron las siguientes notas en Física:
10,3,4,5,7,7,7,7,8,8,9,9,5,5,10,10,9,4,10,1,9,2,3,8,5,6,10,9
a- ¿Con qué tipo de variable se está trabajando?
b- Organizar los datos en una tabla. Calcular la frecuencia absoluta, acumulada, relativa y porcentual
c- Calcular la media, mediana y moda
d- Realizar un gráfico de barras para mostrar la información, puede utilizar algún programa informático
10) Con la siguiente información elabore un gráfico circular

El clima en una ciudad durante 30 días es el siguiente:

Nublado Lluvioso Soleado Seminublado Total


5 días 12 días 10 días 3 días 30 días

11) Se ha realzado una encuesta a los alumnos de una escuela para conocer el número de horas semanales que
ven televisión. Los resultados se presentan en la siguiente tabla:
N° de horas Frecuencia
[0;3) 4
[3;6) 8
[6;9) 22
[9;12) 32
[12;15) 30
[15;18) 4

a) ¿Cuántos estudiantes han sido entrevistados?


b) ¿Qué porcentaje de ellos ven la televisión menos de 12 horas?
c) Arme un diagrama de barras mostrando la información
d) Calcule la media mediana y moda

12) En una ciudad de 100.000 habitantes adultos, 46.000 son hombres y 54.000 mujeres. Se quiere hacer una
encuesta a 800 personas ¿Cuántos hombres y mujeres habrá que elegir?
Estadística

Trabajo Practico Nº2

1) De un grupo de mujeres a las que se les preguntó acerca del número de hijos que cada una de ellas tiene, se
obtuvieron las siguientes respuestas:
1,2,1,2,0,2,3,5,2,0,3,1,1,2,3,4,2,3,1,2,

a) Indicar la variable
b) Ordenar de mayor a menor
c) Construir una tabla de frecuencias
d) Representar en un diagrama de barras
e) Calcular las medidas de tendencia central, media mediana y moda
f) Calcular las medidas de dispersión desviación estándar y varianza
2) Las notas de matemática son:

Curso A 6, 7, 7, 8, 1, 2, 6, 7, 6, 5, 8, 9, 4, 5, 7, 6, 2, 6, 5, 8

Curso B 9, 1, 9, 8, 3, 2, 8, 7, 9, 2, 3, 3, 4, 9, 6, 8,7 , 3, 4, 10

a) Calcular la media mediana y moda


b) Calcular el desvió de cada una ¿Cuál es el curso menos disperso?

3) El entrenador del equipo de baloncesto de un club deportivo duda entre seleccionar a Elena o María. Los
puntos conseguidos por cada una, en una semana de entrenamiento, fueron:
Elena 18 23 22 24 19 25 16
María 18 26 18 28 22 17 18

a) ¿Cuál de las dos tiene mejor media?


b) Calcula la desviación típica ¿Cuál de las dos es más regular?

5. Una empresa ganadera tiene tres tipos de vacas lecheras. Se tomaron tres muestras de las distintas razas con
7 vacas por grupo. Cada vaca produjo los siguientes litros de leche en un día:
Raza A Raza B Raza C
13 15 25
12 22 28
11 26 23
20 25 27
16 13 10
18 10 10
20 12 9
a) Qué tipo de vaca produce más leche?. ¿Qué vaca es más fiable en la producción? (Sugerencia calcule la
deviación típica de cada raza)
TRABAJO PRÁCTICO
Medidas de Centralización y de Dispersión( Datos agrupados)

Utilizando los apuntes resuelva lo siguiente


1. Las alturas en centímetros de 20 plantas de determinada especie son:
6,1 5,3 6,2 5,6 4,8 4,9 5,2 5,6 6,1 5,9 6,2 5,9 5,8 5,7 4,9 5,2 5,3 6,1 5,8 5,6

a. Complete la siguiente tabla de frecuencias


Altura N° de plantas (frecuencia)
| 4,5 ; 5,0)
|5,0 ; 5,5)
|5,5 ; 6,0)
|6,0 ; 6,5)

b. Reproduzca los datos de la tabla anterior en un diagrama de frecuencias absolutas.


c. Calcule la media mediana y moda

2. La siguiente tabla representa la duración, en segundos, de varias llamadas telefónicas

Duración (en segundos) N° de llamadas


|0; 30) 2
|30; 60) 6
|60; 90) 15
|90; 120) 31
|120; 150) 62
|150; 180) 43
|180; 210) 15
|210; 240) 8

a. Represente los datos en un gráfico


b. ¿Cuál es la duración media de las llamadas?
c. ¿qué porcentaje de llamadas duró menos de dos minutos?
d. Calcule la variancia (desviación media) y desviación típica
3. Las notas de Matemática correspondientes a dos cursos son las siguientes:

Curso A 8 7 8 6 5 4 6 7 6 8 7 10 7 8 9 3
Curso B 3 6 6 7 4 5 3 2 5 8 8 4 10 10 8 4
a. Calcular la media mediana, moda desviación típica y varianza
b. ¿Cuál es el curso menos disperso?
TRABAJO PRACTICO DE INTEGRACIÓN

1. Para realizar un estudio sobre la nutrición de la población infantil de Tupungato, se consultaron los pesos,
en kilogramos de 50 alumnos de una escuela. Los resultados fueron los siguientes:

40,54 40,25 41,5 41 42,5 43,25 40,3 39,8 41,25 42,5 38,25 41,15 39,25 37,25 41 40,25 36,25

37,75 40,25 39,4 42,25 40,4 40,5 45,75 41,6 43,5 39,8 44,5 41,25 45,2 40,5 45,25 44,85 38,25

39,25 40,75 39,5 42,24 37,75 38,25 38,84 39,25 41,75 38,25 44,45 42,25 36,5 40,75 40,2 36

a) Organice los datos en una tabla (Con un intervalo de 1 kg)


b) Construya un gráfico de barras
c) De acuerdo con la tabla del punto a ¿Cuál es el peso promedio del grupo de alumnos?
d) ¿Cuál es el peso de la mayor cantidad de niños?
e) ¿Entre qué valores está el peso del 50% de los alumnos más livianos?

2. Una consultora realizó un estudio acerca de los sueldos del personal de tres empresas con 500 empleados
cada una. Los resultados obtenidos fueron los siguientes:

Empresa 1

Sueldo $2000 $ 4000 $ 5000 $ 6000 $6500 $7000


Frecuencia 250 150 70 25 3 2

Empresa 2

Sueldo $ 2000 $ 4000 $ 5000 $ 6000 $ 6500 $ 7000


Frecuencia 360 13 69 50 5 3

Empresa 3

Sueldo $ 2000 $ 4000 $ 5000 $ 6000 $ 6500 $ 7000


Frecuencia 200 280 3 3 3 11

a) Para cada una de las distribuciones halle la media. Mediana y moda


b) Para cada empresa calcule el desvío estándar. Decida en cuál de las empresas la media artimética es más
representativa de los datos
3. El dueño de una fábrica de juguetes compró una máquina para cortar cuadrados plásticos, pero antes probó
3 máquinas de igual precio. La medida de los lados en centímetros, de los cuadrados cortados son.
Máquina A: 3,001 3,001 2,999 2,997 3,002
Máquina B: 3,002 3,007 2,996 3,004 2,991
Máquina c: 3,002 3,009 2,999 2,99 3,001

¿Qué máquina le parece que compró el dueño de la fábrica? ¿Por qué?

También podría gustarte