Práctica 1 Estadistica
Práctica 1 Estadistica
Depatamento de Irrigación
Métodos estadísticos
5° A
Diciembre de 2020
Introducción
Con el fin de iniciar el estudio y el uso de los métodos estadísticos para el análisis
de datos, interpretación y aplicación para las diferentes disciplinas, se realiza este
tipo de prácticas, que consiste en iniciar una serie de observaciones sobre algunos
fenómenos comunes en la vida diaria como el encendido de un cerillo o las
dimensiones de la semilla de un frijol.
Los ejemplos mencionados en el párrafo anterior nos pueden dar información
sobre muchos aspectos como la nutrición, la disponibilidad de oxígeno en un
lugar, la altura sobre el nivel del mar, variedad de semilla, entre otras.
Haciendo uso de las medidas de tendencia central y dispersión es posible obtener
datos útiles para conocer más sobre la frecuencia de un fenómeno bajo ciertas
condiciones.
Metodología
Experimento 1
Se inició el experimento seleccionando 100 frijoles de variedades diferentes
variedades de preferencia, los cuales fueron medidos uno a uno registrando sus
medidas de largo y ancho.
Los datos de longitud y ancho fueron registrados en una base de datos para
después utilizar esa información.
Experimento 2
Se seleccionaron dos marcas diferentes de cerillos, de los cuales fueron
seleccionados 40 de cada marca y medidos en longitud.
Se colocó cada uno de los cerillos de manera vertical sobre una superficie que
logró mantener a cada uno de los cerillos en posición para después encender uno
por uno y al mismo tiempo iniciar el conteo del tiempo transcurrido desde donde
inicia la combustión hasta que termina por consumirse el cerillo por completo con
el uso de un cronómetro.
Los datos de los 80 cerillos quemados fueron registrados en una base de datos
para después hacer un análisis de los resultados.
** Las mediciones fueron hechas con precaución y con paciencia, para ello fue
necesario hacer las mediciones a la misma hora durante cuatro días, en un lugar
cerrado a la circulación del aire y a una altura promedio de 2 280 msnm, en la
comunidad de San Diego, Texcoco, Edo Méx, México.
Revisión bibliográfica
n° de datos
Es el total de los datos que serán analizados
Límite inferior
De todos los datos, es el de menor valor.
Límite superior
De todos los datos el de mayor valor
Rango
El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, aún más dispersos están los datos. El rango, también
es llamado amplitud.
Se calcula realizando la diferencia entre el límite superior y el inferior.
Clase
Es el número de subconjuntos en que se han agrupado los datos. Cada clase se puede
denominar mediante una letra, un número o alguna característica del subconjunto.
El número de clases en que se agrupan los datos se determina con la raíz cuadrada del
número de datos cuando este es menor de 200.
Intervalo de clase
Es un conjunto de elementos que forman a una clase, conteniendo un límite inferior y un
límite superior.
Tamaño de clase
Es la diferencia entre dos límites inferiores o superiores de clases sucesivas.
Frecuencia.
Es el número de datos que pertenecen a cada clase.
Promedio
En matemáticas y estadística, la media aritmética, también llamada promedio o
media, de un conjunto finito de números es el valor característico de una serie de
datos cuantitativos, objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus valores
dividida entre el número de sumandos.
Propiedades
Moda
La moda estadística de un conjunto de datos, se define como el número que está
representado más veces dentro de esos datos, es decir, aquel número que
presenta una mayor frecuencia absoluta dentro de la muestra.
La moda puede ser calculada tanto para variables cuantitativas como
para variables cualitativas.
Mediana
La palabra mediana es sinónimo de “medio” y la mediana muestral es ciertamente
el valor medio cuando las observaciones se ordenan de menor a mayor magnitud.
Cuando las observaciones se denotan por X 1, . . . , Xn, en la cual será utilizado el
símbolo ẋ para denotar la media.
Varianza r²
Es una medida de dispersión que representa la variabilidad de una serie de datos
respecto a su media. Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones .
Desviación Estándar
La desviación estándar o desviación típica es una medida que ofrece información
sobre la dispersión media de una variable. La desviación estándar es siempre
mayor o igual que cero.
La desviación estándar cuantifica la dispersión alrededor de la media aritmética.
Informa de la media de distancias que tienen los datos respecto de su media
aritmética.
Covarianza
En probabilidad y estadística, la covarianza es un valor que indica el grado de
variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato
básico para determinar si existe una dependencia entre ambas variables y además
es el dato necesario para estimar otros parámetros básicos, como el coeficiente de
correlación lineal o la recta de regresión.
Cuando los valores altos de una de las variables suelen mayoritariamente
corresponderse con los valores altos de la otra, y lo mismo se verifica para los
pequeños valores de una con los de la otra, se corrobora que tienden a mostrar
comportamiento similar lo que se refleja en un valor positivo de la covarianza
Por el contrario, cuando los valores altos de una variable suelen corresponder
mayoritariamente a los menores valores de la otra, expresando un
comportamiento opuesto, la covarianza es negativa.
Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra
y su media.
Histograma de frecuencias
Es una herramienta usada para representar una distribución por medio de barras.
La altura de la barra está en función de la frecuencia (eje y) y el rango (eje x) de
una variable continua.
Tiene diferentes beneficios dependiendo del uso que se le dé. Es común que en
las empresas y comunidades se usen para:
1 1.1 0.6
2 1 0.7
3 1.2 0.8
4 1.1 0.6
5 1.1 0.7
6 1.2 0.8
7 1 0.7
8 1.2 0.7
9 1 0.7
10 1.1 0.6
11 1 0.7
12 1.2 0.7
13 1.2 0.8
14 1.1 0.8
15 0.9 0.6
16 1 0.7
17 1.1 0.7
18 1.1 0.8
19 1 0.6
20 1.1 0.8
21 1.2 0.8
22 1.1 0.8
23 1.2 0.7
24 1.2 0.8
25 1.2 0.9
26 1.1 0.8
27 1.1 0.7
28 1.1 0.8
29 1.1 0.8
30 1.2 0.8
31 1.1 0.7
32 1.3 0.7
33 1.1 0.8
34 1.1 0.7
35 1.1 0.7
36 1.2 0.7
37 1.1 0.7
38 1.1 0.7
39 1.2 0.8
40 1.4 0.7
41 1.1 0.8
42 1.1 0.7
43 1.2 0.8
44 0.9 0.6
45 1.2 0.9
46 1.2 0.8
47 1.2 0.9
48 1 0.8
49 1.3 0.9
50 1.1 0.7
51 1.2 0.8
52 1.1 0.9
53 1.3 0.9
54 1.2 0.8
55 1.2 0.9
56 1.2 0.8
57 1 0.8
58 1.2 0.8
59 1.1 0.7
60 1.1 0.8
61 1.1 0.8
62 1.1 0.8
63 1 0.5
64 1.2 0.7
65 1.2 0.9
66 1.3 0.9
67 1.2 0.9
68 1.1 0.8
69 1.2 0.8
70 1.1 0.7
71 1.2 0.8
72 1.2 0.9
73 1.3 0.7
74 1.2 0.8
75 1.1 0.8
76 1.2 0.8
77 1.1 0.8
78 1.2 0.8
79 1 0.7
80 1.1 0.8
81 1.1 0.7
82 1.2 0.9
83 1.1 0.8
84 1.2 0.8
85 1.2 0.7
86 1.2 0.8
87 1.1 0.8
88 1.2 0.8
89 1.1 0.9
90 0.9 0.7
91 1.1 0.8
92 1.1 0.8
93 1.1 0.7
94 1.1 0.8
95 1.1 0.7
96 1.2 0.8
97 1.2 0.8
98 1.1 0.7
99 1.1 0.8
100 1.1 0.6
Resultados experimento 2
Cerillos marca La Central®
Análisis de datos
Para todos los experimentos se realizaron cálculos con las medidas de tendencia
central y las de dispersión vistas en clase, así como un ordenamiento en los datos
para graficar los resultados obtenidos.
Para el experimento 1 fue necesario hacer un análisis separado de las variables,
las cuales fueron ancho y largo de cada semilla.
En primer lugar, ordenamos los datos de la longitud
Frijol
negro
Frijol Largo
(cm)
1 0.9
2 0.9
3 0.9
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 1
12 1
13 1
14 1.1
15 1.1
16 1.1
17 1.1
18 1.1
19 1.1
20 1.1
21 1.1
22 1.1
23 1.1
24 1.1
25 1.1
26 1.1
27 1.1
28 1.1
29 1.1
30 1.1
31 1.1
32 1.1
33 1.1
34 1.1
35 1.1
36 1.1
37 1.1
38 1.1
39 1.1
40 1.1
41 1.1
42 1.1
43 1.1
44 1.1
45 1.1
46 1.1
47 1.1
48 1.1
49 1.1
50 1.1
51 1.1
52 1.1
53 1.1
54 1.1
55 1.1
56 1.1
57 1.1
58 1.2
59 1.2
60 1.2
61 1.2
62 1.2
63 1.2
64 1.2
65 1.2
66 1.2
67 1.2
68 1.2
69 1.2
70 1.2
71 1.2
72 1.2
73 1.2
74 1.2
75 1.2
76 1.2
77 1.2
78 1.2
79 1.2
80 1.2
81 1.2
82 1.2
83 1.2
84 1.2
85 1.2
86 1.2
87 1.2
88 1.2
89 1.2
90 1.2
91 1.2
92 1.2
93 1.2
94 1.2
95 1.3
96 1.3
97 1.3
98 1.3
99 1.3
100 1.4
Histograma de frecuencias
interval
o Frecuenci
inferior superior a X F. acumulada X.F (X - ẋ)² (X - ẋ)² . F
120 44
100
80
60
40
20
0
0.9 0.95 1 1.05 1.1 1.15 1.2 1.25 1.3 1.35
En este caso es posible apreciar que el dato con el valor mínimo es de 0.5
cm para el ancho y el mayor es de 0.9 cm.
Debido a que los datos no varían por mucho, solo se crearon cuatro clases
con una amplitud de 0.1 cm.
La medida promedio de ancho en esta variedad de frijol es de 0.76 cm.
El valor de ancho que se repitió más veces fue de 0.8 cm.
En este caso la varianza fue mayor.
De estos datos se obtuvieron las siguientes gráficas.
120
100
100 87
80
60
40
40
20 8
1
0
0.5 0.6 0.7 0.8 0.9
32
47
01 4 4 30 0
11 4 8 40 0
11 1 2 10 0
11 3 5 40 0
11 2 8 30 0
11 1 9 20 0
11 3 1 40 0
Con los datos anteriores realizamos las gráficas correspondientes.
97 100
100
81
80
57
60
40
20
20
8
4
0
0.9 1 1.1 1.2 1.3 1.4 1.5
Gráfico tipo pastel de longitudes del frijol pinto
3 4
4
16
12 0.9 - 1
1 - 1.1
1.1 - 1.2
1.2 - 1.3
1.3 - 1-4
1.4 - 1.5
1.5 - 1.6
24
37
En los datos que se obtuvieron de las medidas de ancho para esta variedad de
frijol es noble ver que el número con el menor valor de media fue de 0.5 cm y de
mayor es de 1.3 cm.
La diferencia entre el límite superior y menor es de apenas 0.8 cm.
La medida promedio en ancho para esta variedad es de 0.79 cm casi 0.8 cm.
A partir de la información se crean las siguientes tablas para ordenar los datos, así
como sus respectivas gráficas.
lim lim x Frecuenci M.C F. X.F (X - ẋ)² (X - ẋ)² .
inferior superior a acumulad F
a
0.5 0.7 0.6 5 0.05 5 3 4.87084 24.35424
9 5
0.7 0.9 0.8 70 0.7 75 56 0.00049 0.0343
0.9 1.1 1 24 0.24 99 24 0.04284 1.028376
9
1.1 1.3 1.2 1 0.01 100 1.2 0.16564 0.165649
9
En esta gráfica es fácil apreciar que la mayoría de los datos tienen un valor de 0.7
cm y solo 1 de ellos mide 1 cm siendo este un dato atípico.
En el grafico tipo pastel es más fácil de ver la distribución de los datos, los que
representan la mayoría y las minorías.
120
100
80
60
40
20
0
0.5 0.7 0.9 1.1
Gráfico tipo pastel de las medidas de ancho de los
frijoles var clara
1
5
24 0.5 - 0.7
0.7 - 0.9
0.9 - 1.1
1.1 - 1.3
70
La tabla anterior puede ser representada por medio de gráficas para observar la
información de manera más rápida.
20
18
16
14
12
10
8
6
4
2 Gráfica tipo ojiva
0
35.45
45 37.45 39.45 41.45 43.45 45.45 47.45
40
40 38
35 33
30
25
20
14
15
10 8
4
5 1
0
33.45 35.45 37.45 39.45 41.45 43.45 45.45
33.45 - 35.45
Gráfica tipo pastel de la frecuencia de los tiempos de 35.45 - 37.45
37.45 - 39.45
combustión de los cerillos Clásicos® 39.45 - 41.45
41.45 - 43.45
43.45 - 45.45
2 1 45.45 - 47.45
3
5
4
19
En esta grafica se puede relacionar cada color y la frecuencia del tiempo en que
se quemó cierto número de cerillos.
Y es accesible ver que la mayoría de los cerillos se consumió en el intervalo de
39.5 a 43.5 segundos.
20 20
15 15
10 10
5 5
0 0
43.2 45.2 47.2 49.2 51.2 53.2
45
40
35
30
25
20
15
10
5
0
43.2 45.2 47.2 49.2 51.2 53.2
Grafica tipo ojiva que representa los valores máximos de cada intervalo en función
de su frecuencia.
43.2 - 45.2
Gráfico tipo pastel del la frecuencia de la combustión de45.2 - 47.2
47.2 - 49.2
cerillos Manola® 49.2 - 51.2
51.2 - 53.2
53.2 - 55.2
1 1
7
7
23
El gráfico muestra que la mayoría de los cerillos tuvo una duración de combustión
ubicada en el intervalo comprendido entre 49.2 y 51.2 segundos.
Así como datos atípicos con frecuencia 1.
Conclusiones
Experimento 1 Frijoles
Los frijoles de la variedad pinto son más grandes tanto en longitud como
ancho.
Los frijoles negros de la variedad Chapingo son muy pequeños en ambas
variables.
Es recomendable hacer una comparación y análisis sobre dos tipos de
variedades con características similares, ya que la diferencia es muy
marcada.
En el experimento de los frijoles se realizó el calculo de la covarianza por
tener presentes dos variables, en ambas el resultado fue positivo, haciendo
referencia a una posible relación entre las variables de largo y ancho.
Experimento 2. Tiempo de combustión de dos marcas de cerillos.
Los cerillos que duran más tiempo en combustión son los de marca Manola
®, duran hasta 10 segundos más en comparación con la marca Clásicos®.
Las mediciones fueron objetivas y bajo las mismas condiciones de corriente
de aire.
Los cerillos están hechos de los mismos materiales aparentemente, y
difieren en su longitud por dos o tres milímetros.
Conclusión general
Este tipo de prácticas favorecen la comprensión del uso y la toma de datos
para conocer el tipo de variables que intervienen en procesos comunes de la
rutina diaria, los cuales pueden ser usados para representar fenómenos
relacionados a nuestro campo de estudio.
Es un poco limitado el conocimiento de uso de software para el proceso de los
datos, pero de alguna manera es posible usar otras herramientas para el
cálculo y las gráficas.