0% encontró este documento útil (0 votos)
57 vistas12 páginas

Introducción a la Estadística y Análisis de Datos

La estadística es la ciencia que se encarga de la recolección, análisis e interpretación de datos para la toma de decisiones. Se divide en estadística descriptiva, que organiza y presenta datos, y estadística inferencial, que infiere características de una población a partir de una muestra. El documento también detalla conceptos como población, muestra, variables cualitativas y cuantitativas, y métodos de recolección y análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
57 vistas12 páginas

Introducción a la Estadística y Análisis de Datos

La estadística es la ciencia que se encarga de la recolección, análisis e interpretación de datos para la toma de decisiones. Se divide en estadística descriptiva, que organiza y presenta datos, y estadística inferencial, que infiere características de una población a partir de una muestra. El documento también detalla conceptos como población, muestra, variables cualitativas y cuantitativas, y métodos de recolección y análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadística

Es la ciencia que proporciona un conjunto de informaciones, métodos y procedimientos


para la recolección, clasificación, análisis e interpretación de los datos para tomar
decisiones.
Es una metodología que nos provee de un conjunto de métodos y procedimientos, para la
recolección, organización, análisis e interpretación de datos, para la toma decisiones en
situaciones de incertidumbre. Por ejemplo, estudiar la venta de juguetes, para averiguar
qué meses del año será más favorable la producción de ellos.

Clases de Estadística
Estadística Descriptiva:
Es la que se ocupa de la recolección, organización, presentación, descripción y
simplificación de datos.

Estadística Inferencial:
Es la parte de la Estadística que en base a los resultados del análisis de los datos y a
teorías necesarias, pretende inferir las peculiaridades y las leyes que gobiernan la
población de la cuál provienen los datos.

Población y Muestra
Población
Es el conjunto de todos los individuos (características comunes), que se pretenden
estudiar.

Ejemplo:
Se desea averiguar la edad promedio de los alumnos de los colegios particulares de
Arequipa.

Muestra
Es un subconjunto de la población.

Ejemplo:
En el mismo ejemplo anterior, solo se considera el colegio particular Divino Maestro.

Variables Estadísticas
Variable Cualitativa
Cuando presenta una cualidad, característica o atributo de la población. Consiste en
clasificar las variables por categorías. No lleva clasificación numérica.

Ejemplo:
La variable “contextura” con posibles valores “gruesa”, “delgada”. También, la variable
“Estado civil" puede adoptar las modalidades: soltero, casado, divorciado, viudo, etc.
• VariableCuantitativa
Cuando los valores que toma son números. Ejemplo: peso, estatura, etc.

• Variable Cuantitativa Discreta


Cuando toma valores enteros, como: La cantidad de enfermos del SIDA o el
número de integrantes de una familia pueden ser: 3 o 4, pero no un valor
entre ellos.

• Variable Cuantitativa Continua


Cuando toma valores fraccionarios como: Tiempo de vida de un foco, también
podemos decir que una persona puede pesar 68 kg o 69 kg o cualquier valor
comprendido entre ellos.

Recopilación de los datos


Los métodos de recolección de datos son diversos y dependen de las posibilidades de
acceso o contacto con los elementos investigados, del tamaño de la población y de la
oportunidad de obtener los datos.

Organización y presentación de datos


Una vez recolectados los datos, se procede a su organización, clasificación y tabulación,
de modo que se facilite su presentación en una tabla (tabla de frecuencia), donde se
distribuyen las observaciones en categorías o clases.

Análisis de las variables


Variable cualitativa
Ejemplo En una encuesta a 40 estudiantes de una academia, se recogió la siguiente
información sobre el distrito de residencia:

Número de En
estudiantes porcentaje
Villa María 20 50%
Villa El Salvador 10 25%
San Juan de 8 20%
Miraflores
Chorrillos 2 5%
Total 40 100%

También se puede usar el diagrama circular.

Gráfica de sectores circulares


Debido a que las variables cualitativas no guardan una relación de orden, se pueden
utilizar los diagramas de sectores para representar dichas variables. Del ejemplo
anterior:
Número de En Grados
estudiantes porcentaje
Villa María 20 50% 180º
Villa El Salvador 10 25% 90º
San Juan de 8 20% 72º
Miraflores
Chorrillos 2 5% 18º
Total 40 100% 100º

Variable cuantitativa
Discreta
Ejemplos. Se analiza el número de hijos de 5 familias.
Número Familia
de hijos
0 Tito
1 Salcedo
2 Caldas
3 Gonzales
1 Ceni

Se encuesto a 100 personas sobre el número de veces que han acudido al hospital.
Número Número
de de
veces personas
[0;1] 20
[2;3] 10
[4;5] 40
[6;8] 4
[9;10] 16
[11;15] 10

Continua
Ejemplo
Se tiene el ingreso quincenal de 20 personas tomadas al azar de un distrito.
0 80 120 250 250 270 300 300
370 380 380 400 450 450 450 460
470 470 490 500 600

Antes de colocar los datos en una tabla de distribución de frecuencias, presentaremos a


continuación los elementos fundamentales, donde se usarán dichos datos.
Alcance (A)
Es el intervalo cerrado que considera como límites al menor y al mayor de los datos.
A = [0; 600]

Rango (R)
Es la amplitud del alcance. Se calcula como la diferencia del mayor y el menor de los
datos.
R = 600-0 = 600

Tamaño del intervalo


Es conveniente que los intervalos de clase sean del mismo tamaño.

Amplitud de clase: C=R/K

Intervalo de clase
Es una partición del alcance.

i) Regla de Sturges: k = 1 + 3,3(log n ); n > 10


¡i) Alternativamente se puede utilizar:
k = √𝑛 ; 25 < n < 400
𝐼1 = [0; 120⟩
𝐼2 = [120; 240⟩
𝐼3 = [240; 360⟩
𝐼4 = [360; 480⟩
𝐼5 = [480; 600⟩

Límite de un intervalo
Tenemos que
Li: límite interior
Ls: límite superior

𝐼1 = [0; 120⟩
L.s.

L.i
.

Ancho de clase (wi)


wi=Ls-Li
Ejemplo:
𝐼2 = [120; 240⟩
w2=240-120

Marca de clase(xi)
Es la media de los límites de un intervalo.
Ejemplo:
𝐼2 = [120; 240⟩
X2=(240+120)/2
X2=180

Frecuencia absoluta (fi):


Indica el total de datos en un intervalo.
Ejemplo:
Ii fi
[0; 120⟩ 2

Frecuencia absoluta acumulada (Fi)


Indica la cantidad de datos que hay hasta un determinado intervalo.
Ejemplo:
Ii fi Fi
[0; 120⟩ 2 2
[120; 240⟩ 1 3

Frecuencia relativa (hi)


Es el cociente entre la frecuencia absoluta del dato y el total de datos.
hi=fi/n

Ii fi hi
[0; 120⟩ 2 2/20

hi=2/20=0,13

Frecuencia relativa acumulada (Hi)


Hi=Fi/n

fi Fi hi Hi
2 2 2/20 2/20
1 3 1/20 3/200

Acontinuación veamos la tala completa con todos sus elementos

Ii xi fi Fi hi Hi
𝐼1 = [0; 120⟩ 60 2 2 2/20=0,1 2/20=0,1

𝐼2 = [120; 240⟩ 180 1 3 1/20=0,05 3/20=0,4

𝐼3 = [240; 360⟩ 300 5 8 5/20=0,25 8/20=0,4

𝐼4 = [360; 480⟩ 420 9 17 9/20=0,45 17/20=0,85

𝐼5 = [480; 600⟩ 540 13 20 3/20=0,15 20/20=1

De la tabla se concluye lo siguiente:


𝑓1 + 𝑓2 + 𝑓3 + ⋯ − 𝑓𝑘 = 𝑛 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠)
𝑓1 = 𝐹1
𝑓1 + 𝑓2 = 𝐹2
𝑓1 + 𝑓2 + 𝑓3 + ⋯ − 𝑓𝑘 = 𝐹 𝑘
ℎ1 + ℎ2 + ℎ3 + ⋯ ℎ𝑘 = 1
ℎ1 = 𝐻1
ℎ1 + ℎ2 = 𝐻2
ℎ1 + ℎ2 + ℎ3 + ⋯ ℎ𝑘 = 𝐻𝑘

Ejercicios propuestos

1.- Halle el rango de los siguientes datos:


0;1;3;5;2;6;4;3;5;1
a)1 b)3 c)4 d)2 e)6

2.-Halle el rango del conjunto de valores mostrados:


4;3;4;2;1;3;1;2;3;1
a)2,5 b)3 c)4 d)1 e)2

3.-A continuación, se presentan las notas obtenidas en Aritmética por un grupo de 20


estudiantes en un aula determinada.
12 10 6 8 18 7 13 13 16 9
13 12 11 13 18 19 7 17 12 13

Complete la siguiente tabla de distribución de frecuencias.


Ii xi fi Fi hi Hi
[6; 8⟩

[8; 10⟩

[10; 12⟩

[12; 14⟩

[14; 16⟩

[16; 18⟩

[18; 20⟩

Calcule F3+x2.
a)14 b)15 c)16 d)12 e)11

Calcule H5.
a)42% b)64% c)36% d)85% e)75%
4.-Complete la tabla de distribución de frecuencias y luego calcule x2+f4.
Ii xi fi
[20; 30⟩ 10

[ ;⟩ 60

[ ;⟩ 15

[ ;⟩ 60

[ ;⟩ 105

a)34 b)95 c)48 d)61 e)27

5.-De la tabla:
Ii xi fi hi
[ ; ⟩ 3

[ ; ⟩ 7

[ ; 40⟩ 12

[ ; ⟩ 18

[50; ⟩ 10

Hallar h1+h3+h5
a)1 b)0,5 c)0,8 d)0,2 e)0,3

Hallar x2+x3+f5
a)90 b)10 c)30 d)50 e)70

6.-Se tiene la siguiente distribución de frecuencias relativas acumuladas:


Ii Hi
[4; 6 ⟩ A

[6; 8⟩ 2A

[8; 10⟩ 4A

[10; 12⟩ 5A

[12; 14⟩ 13A

Hallar el valor de A:
a)0,07 b)0,3 c)0,1 d)0,15 e)0,2

Hallar A + h5
a)0,78 b)0,24 c)0,69 d)0,52 e)0,11
7.-La tabla muestra las edades de 80 alumnos.

Edades xi fi hi
[14; 16 ⟩ 0,25

[16; 18 ⟩ 8

[18; 20⟩ 0,2

[20; 22 ⟩

[22; 24 ⟩ 0,35

Hallar h2+h4
a)0,8 b)0,4 c)0,6 d)0,2 e)0,1

8.- En el siguiente cuadro, nos muestran las notas de 200 alumnos.

Edades fi
[0; 5 ⟩ 70

[5; 10 ⟩ 40

[10; 15⟩ 50

[15; 20 ⟩ 40

¿Cuál es el porcentaje de alumnos que tienen menos de 15?


a)80% b)44% c)62% d)28,3% e)15%

¿Cuántos alumnos tienen notas entre 5 y 15? ¿Cuál es el porcentaje?


a)48 y 78% b)70 y 64% c)90 y 45% d)90 y 25% e)68 y 15%

9.-El siguiente cuadro muestra la distribución de edades de un cierto número de


personas. Calcule x+y+z.

Ii xi fi Fi hi Hi
20; 30⟩ 80 0,5

[30; 40⟩ 40 0,25 z

[40; 50⟩ A y 0,15

[50; 60⟩ x

a)180,8 b)160,75 c)170,62 d)150,283 e)140,15


10.- Se tiene la siguiente distribución de frecuencias relativas acumuladas.
Ii Hi
[4; 6 ⟩ B

[6; 8⟩ 2B

[8; 10⟩ 4B

[10; 12⟩ 5B

[12; 14⟩ 13B

Calcule h2+x3.
a)9,07 b)90,7 c)9 d)94,0 e)0,4

11.-En una empresa, se hizo el estudio sobre las edades de los empleados y se obtuvo la
siguiente tabla.

Donde A es el porcentaje de empleados con 30 años o más, B es el porcentaje de


empleados con menos de 40 años. Señale A+B.
a) 148,6% b) 160,8% c) 180,6% d) 186,4% e) 164,8%

12.-La siguiente tabla muestra el número de jóvenes que obtuvieron los puntajes
señalados en una prueba de ingreso.

Donde A es el porcentaje de jóvenes con puntaje mayor a 20. B es el porcentaje de


jóvenes con puntaje menor a 15. Halle A-B.
a) 16,6% b) 61,1% c) 46,4% d) 64,6% e) 71,7%

13.-Dado el tablero incompleto de la distribución de frecuencias de las notas de 50


alumnos. Completar el tablero, con un ancho de clase constante e igual a 2. Señale:
¿cuántos alumnos sacaron un puntaje menor de 10? y ¿qué porcentaje de alumnos
obtuvieron 12 o más de 12 pero menos de 16?
a) 20 y 30% b) 30 y 20% c) 25 y 25% d) 20 y 25% e) 30 y 25%

14.-Dada la siguiente tabla incompleta, de las frecuencias de las edades de 80


empleados:

Siendo el ancho de clase constante, encontrar:


a) ¿Cuántos empleados tienen más de 30 años?
b) ¿Qué porcentaje del total de empleados poseen menos de 42 años?
a) 37 ; 81,25% b) 37 ; 18,75% c) 37 ; 31,25% d) 73 ; 81,25% e) 73 ; 18,75%

15.-La tabla muestra la distribución de pesos correspondientes a 40 estudiantes, con un


ancho de clase constante.

Señale la cantidad de estudiantes que pesan menos de 67 kg y el porcentaje de


estudiantes que pesan 61 kg o más pero menos de 70 kg
a) 27 y 60% b) 13 y 60,5% c) 27 y 61% d) 13 y 62% e) 27 y 62,5%

16.-Dada la siguiente distribución de frecuencias en base al ingreso familiar de 200


familias:

¿Cuántas familias tienen un ingreso comprendido entre 230 y 300 soles?


a) 100 b) 120 c) 125 d) 130 e) 152

17.-Dada la siguiente distribución de frecuencias, en base a las edades de 120 personas.


Se conoce que los que tienen 42 o más años, son menos de 20, de los cuales 3 son
casados.

¿Cuántos tienen entre 28 y 32 años?


a) 20 b) 22 c) 24 d) 18 e) 16

18.-Se conoce la siguiente distribución en base a los pesos de 80 niños.

¿Cuántos niños tienen pesos comprendidos entre 21 y 28kg?


a) 55 b) 52 c) 50 d) 45 e) 25

19.-Dada la siguiente distribución de frecuencias, de ancho constante. Señale cuantos


valores se encuentran comprendidos en el intervalo [20; 30>.

a) 20 b) 30 c) 40 d) 25 e) 35

20.-Se tiene la siguiente tabla de frecuencias relativas de 200 personas, según el tiempo
de años de servicio en una fábrica:
¿Cuántos empleados han trabajado entre 10 y 15 años?
¿Qué porcentaje tiene 8 ó más años de servicio, pero menos de 14?
a) 73, 74% b) 37, 47% c) 37, 74% d) 73, 47% e) 43, 77%

También podría gustarte