FASE 4.
APLICAR CONCEPTOS A UN PROYECTO AGROPECUARIO CON
PROCESAMIENTO ESTADÍSTICO.
PRESENTADO POR:
ERBIN ROJAS VALENZUELA.
COD: [Link]
PRESENTADO A:
ISMAEL DUSSAN HUACA
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)
PROGRAMA DE AGRONOMIA
ESTADISTICA DESCRIPTIVA
2020
TABLA DE CONTENIDO.
INTRODUCCIÓN. ................................................................................................................ 3
OBJETIVOS........................................................................................................................... 4
Definicion de área de trabajo ................................................................................................. 5
Indicación de ubicación del área de trabajo. .......................................................................... 5
Determinación de las variables. ............................................................................................. 5
Presentación del codigo con sus respetivas modificaciones. ................................................. 5
VARIABLE CONTINUA. ................................................................................................... 12
Resultados obtenidos. .......................................................................................................12
Tabla de frecuencias de la variable continua. ...................................................................13
Graficas Obtenidas de la Variable Continua ....................................................................13
VARIABLE CUANTITATIVA DISCRETA. ..................................................................... 14
Resultado obtenidos. .........................................................................................................14
Graficas Obtenidas de la Variable Discreta. .....................................................................16
VARIABLE CUALITATIVA O CATEGORICA ............................................................... 20
Gráficos Obtenidos de la variable Cualitativa o Categórica.............................................21
CONCLUSIONES. .............................................................................................................. 22
INTRODUCCIÓN.
En este trabajo podemos evidenciar la realización de una práctica con 30 árboles de cacao
en producción, en el municipio de solano-Caquetá, vereda los ángeles, finca la ceiba, donde
determinamos la producción diaria de cada planta, cantidad de frutos por árbol y en el estado en
el que se encuentra cada individuo. Por lo tanto, se logra identificar las tres variables: variable
continua, variable discreta y variable categórica, para del mismo modo poder identificarlas y
analizarlas en el programa R.
OBJETIVOS.
• Identificar e interpretar los datos expuestos en el código.
• Aprender a introducir los datos al código para ejecutarlo en el programa R.
• Comprender la representación de cada gráfico.
1. Definir un área de trabajo donde se puedan obtener datos de variables continuas,
discretas y cualitativas.
Se realizo la practica con 30 árboles de cacao en estado de producción, en la finca la Ceiba del
Municipio de Solano-Caquetá.
2. Indicar la ubicación del sitio fuente de los datos: institución, municipio, vereda y/o finca si
aplica.
LOCALIDAD: COLOMBIA, Caquetá, ALTITUD: 248 msnm
Solano
GEOREFERENCIACIÓN: LAT: N 0° FINCA: La Ceiba
48' 25,54056" LONG: W 75° 21'
24,64992"
VEREDA: Los Ángeles INSTITUCIÓN: Universidad Nacional
Abierta y A Distancia (UNAD)
3. Determinar una variable continua, una discreta y una cualitativa. Se debe realizar una
descripción clara de cada una de las variables elegidas.
Variable Continua Variable Discreta Variable Categórica
Producción diaria de cada Cantidad de frutos de cacao. Estado de los árboles.
árbol.
2.2, 2.5, 2.1, 1.7, 3.2, 3.3, 10,12,7,9,11,17,9,8,17,13,16,1 Sin Daño.
2.7, 1.2, 1.7, 3.6, 3.2, 2.9, 0,18,20,7,12,15,18,8,9,13,10,1 Daño Bajo.
3.1, 1.7, 0.7, 2.3, 1.1, 2.9, 5,8,12,12,11,13,12,10 Daño Medio.
0.7, 2.7, 0.9, 0.5, 2.5, 0.7, Daño Alto.
1.7, 2.4, 1.6, 1.8, 2.1, 0.8
4. Presentar el código con las modificaciones realizadas, no se deben presentar pantallazos,
solamente copiarlo y pegarlo dentro del informe.
# VARIABLE CUANTITATIVA CONTINUA
# Ejemplos: la produccion diaria de 30 árboles de cacao por día.
# En el siguiente renglón reemplace y digite los 30 datos de su
variable CONTINUA, separándolos con comas. Para números decimales use
punto:
#se muestran los resultados como variable continua, la produccion
diaria de cacao por cada arbol en libras.
CONTINUA=c(2.2,2.5,2.1,1.7,3.2,3.3,2.7,1.2,1.7,3.6,3.2,2.9,3.1,1.7,0.7,
2.3,1.1,2.9,0.7,2.7,0.9,0.5,2.5,0.7,1.7,2.4,1.6,1.8,2.1,0.8)
# RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
summary(CONTINUA)# Resumen estadístico
mean(CONTINUA)#media aritmética
var(CONTINUA)#varianza
sd(CONTINUA)#desviación estándar
min(CONTINUA) #Mínimo
max(CONTINUA)# Máximo
range(CONTINUA) #Rango
median(CONTINUA)# Mediana
length(CONTINUA)# Número de datos
quantile(CONTINUA, 0.25)# Cuantil Q1
quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
quantile(CONTINUA, 0.75)# Cuantil Q3
IQR(CONTINUA) #Rango intercuartílico
sort(CONTINUA)# Ordenar
# TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON REGLA DE
STURGES
# La regla de Sturges define el número de rangos para organizar la
tabla de frecuencias:
range(CONTINUA,[Link]=TRUE) # incluimos [Link]=TRUE para que ignore la
presencia de valores perdidos
[Link](CONTINUA)# Define el número de intervalos para presentar
la frecuencia de la variable (en este caso, 6 intervalos)
seq(min(CONTINUA),max(CONTINUA),length=[Link](CONTINUA)) #
Límites de los intervalos
intervalosCONTINUA=cut(CONTINUA,breaks=seq(min(CONTINUA),max(CONTINUA),
length=[Link](min(CONTINUA))),[Link]=TRUE)
intervalosCONTINUA# Se muestran los intervalos de produccion diaria por
cada arbol de cacao.
puntos=min(CONTINUA)+(0:[Link](CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/[Link](CONTINUA)
hist(CONTINUA, breaks=puntos)# histograma de frecuencias usando la
regla de Sturges
# Instalación de la libreria agrícolae (permite el uso de otras
herramientas estadísticas):
# En "Secure CRAN mirrors", seleccionar: "USA(IA)"
#Tener paciencia, ya que la instalación puede tomar varios minutos
#Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la
parte inferior de la consola R
[Link]("agricolae")
library(agricolae) # si la libreria se instaló correctamente, al dar
CONTROL+R se pone Rojo
# TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:
# Existen dos comandos que generan la misma tabla de frecuencia o
histograma:
# Gráficos de tabla de frecuencia:
tbFreqCONTINUA=[Link](hist(CONTINUA,plot=TRUE))
hist(CONTINUA,ylab="Frecuencia",main="Histograma CONTINUA")#Histograma
# Tabla de frecuencia:
tbFreqCONTINUA
# Gráfico de diagrama de cajas o Boxplot (organiza los datos en los
cuatro cuartiles):
boxplot(CONTINUA,ylab="unidad de medida",main="Boxplot
CONTINUA")#Gráficos de cajas
# VARIABLE CUANTITATIVA DISCRETA
# Son variables de conteo, como número de personas que habitan un
predio, número de crías por parto, número de frutos por cosecha, etc.
# En el siguiente renglón, reemplace y digite los 30 datos de su
variable DISCRETA, separándolos con comas:
#Como variable cuantitativa discreta tenemos la cantidad de frutos por
cada arbol de cacao.
DISCRETA=c(10,12,7,9,11,17,9,8,17,13,16,10,18,20,7,12,15,18,8,9,13,10,1
5,8,12,12,11,13,12,10)
# RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
summary(DISCRETA) # Resumen estadístico
min(DISCRETA) # Mínimo
max(DISCRETA) # Máximo
range(DISCRETA) # Rango
mean(DISCRETA) # Media aritmética
median(DISCRETA) # Mediana
length(DISCRETA) # Número de datos
sd(DISCRETA) # Desviación standar
quantile(DISCRETA, 0.25) # Cuantil Q1
quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
quantile(DISCRETA, 0.75) # Cuantil Q3
IQR(DISCRETA) # Rango intercuartílico
sort(DISCRETA) # Ordenar
# Para las variables discretas, las tabla de frecuencias se desarrollan
por pasos:
FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de
"FrAbsDiscreta" para la Tabla de frecuencias absolutas de la variable
discreta
FrAbsAcumDiscreta<-[Link](cumsum(FrAbsDiscreta))# Se le asigna el
nombre de "FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas
acumuladas de la variable discreta
FrAbsAcumDiscreta #Frecuencias absolutas acumuladas
FrRelDiscreta=[Link](table(DISCRETA))# Se le asigna el nombre de
"FrRelDiscreta" para la Tabla de frecuencias relativas de la variable
discreta
FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se
presenta de 0 a 1 y para pasarla a porcentaje se multiplica por 100
FrRelAcumDiscreta<-[Link](cumsum(FrRelDiscreta)) #Frecuencias
relativas acumuladas
FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por
100
# GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA VARIABLE
DISCRETA:
barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="Diagrama de
barras Frecuencia Absoluta DISCRETA")
barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="Diagrama de
barras Frecuencia Relativa DISCRETA")
barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta
Acumulada",main="Diagrama de barras Frecuencia Absoluta Acumulada
DISCRETA")
barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa
Acumulada",main="Diagrama de barras Frecuencia Relativa Acumulada
DISCRETA")
# Gráfico de diagrama de cajas o Boxplot para variables discretas
(organiza los datos en los cuatro cuartiles):
boxplot(DISCRETA)
# GRÁFICO DE TORTA PARA VARIABLE DISCRETA:
pie(FrAbsDiscreta,col=rainbow(6),main=c("Grafico de tarta Frecuencia
Absoluta DISCRETA")) # Gráfico de tarta
# VARIABLE CUALITATIVA O CATEGÓRICA
# Son atributos no numéricos, como el nivel de estudios de una persona,
el nivel de ingreso, o el grado de ataque de un patógeno.
# Para poder analizarlos es necesario codificarlos
# Por ejemplo, se presenta el estado actual de nuestros arboles de
cacao. se pueden asignar cuatro niveles:
# 1= Sin Daño, 2= Daño Bajo, 3=Daño Medio, 4=Daño Alto
# CATEGORICA = Estado de los arboles de cacao"Sin daño","daño
bajo","daño medio" o "daño alto"
# En el siguiente renglón, reemplace y digite los 30 datos de su
variable CUALITATIVA o CATEGÓRICA, separándolos con comas:
CATEGORICA=c(1,3,3,1,1,4,1,2,1,3,1,1,1,3,2,3,1,2,1,2,1,1,2,4,1,1,1,3,1,
4)
# Es necesario aclararle al programa que cada número es una categoría:
# En el siguiente comando reemplace de acuerdo al número de niveles que
tenga su variable categórica:
CATEGORICA=factor(CATEGORICA, levels=c(1,2,3,4),
# A continuación, indique el nombre de cada categoría:
# reemplace las palabras entre comillas, indicando el nombre de cada
nivel de su variable:
labels=c("Sin Daño","Daño Bajo","Daño Medio","Daño Alto"))
CATEGORICA # Muestra cada dato con el nombre del nivel de la
categoría que se asignó previamente
summary(CATEGORICA) # Hace un resumen del número de individuos que
pertenecen a cada una de las categorías asignadas
table(CATEGORICA) #Tabla de frecuencias absolutas
# Al asignar nombres a los comandos, no se deben repetir los que se
usaron previamente:
FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de
"FrAbsCategorica" para la Tabla de frecuencia absoluta de la variable
categórica o cualitativa
FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la
variable categórica
FrRelCategorica=[Link](table(CATEGORICA))# Se le asigna el nombre
de "FrRelCategorica" para la Tabla de frecuencia relativa de la
variable categorica o cualitativa
FrRelCategorica # Indica la frecuencia de cada nivel en términos de
porcentaje (multiplicar por 100)
# GRÁFICOS DE VARIABLES CUALITATIVAS:
barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de
Barras Frecuencia Absoluta CATEGORICA") # Diagrama de barras
(frecuencia absoluta) para cada nivel de estudios
barplot(FrRelCategorica,ylab="Frecuencias relativas",main="Diagrama de
barras Frecuencia Relativa CATEGORICA") # Diagrama de barras
(frecuencia relativa) para cada nivel de estudios
VARIABLE CONTINUA.
Resultados obtenidos.
summary(CONTINUA)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.500 1.300 2.100 2.017 2.700 3.600
mean(CONTINUA)#media aritmética
[1] 2.016667
var(CONTINUA)#varianza
[1] 0.8179885
sd(CONTINUA)#desviación estándar
[1] 0.9044272
min(CONTINUA) #Mínimo
[1] 0.5
max(CONTINUA)# Máximo
[1] 3.6
range(CONTINUA) #Rango
[1] 0.5 3.6
median(CONTINUA)# Mediana
[1] 2.1
length(CONTINUA)# Número de datos
[1] 30
quantile(CONTINUA, 0.25)# Cuantil Q1
25%
1.3
quantile(CONTINUA, 0.5)# Cuantil Q2 que es la misma mediana
50%
2.1
quantile(CONTINUA, 0.75)# Cuantil Q3
75%
2.7
IQR(CONTINUA) #Rango intercuartílico
[1] 1.4
sort(CONTINUA)# Ordenar
[1] 0.5 0.7 0.7 0.7 0.8 0.9 1.1 1.2 1.6 1.7 1.7 1.7 1.7 1.8 2.1 2.1 2.2 2.3 2.4
[20] 2.5 2.5 2.7 2.7 2.9 2.9 3.1 3.2 3.2 3.3 3.6
Tabla de frecuencias de la variable continua.
Lower Upper Main Frequency Percentage CF CPF
1 0.5 1.0 0.75 6 20.0 6 20.0
2 1.0 1.5 1.25 2 6.7 8 26.7
3 1.5 2.0 1.75 6 20.0 14 46.7
4 2.0 2.5 2.25 7 23.3 21 70.0
5 2.5 3.0 2.75 4 13.3 25 83.3
6 3.0 3.5 3.25 4 13.3 29 96.7
7 3.5 4.0 3.75 1 3.3 30 100.0
Graficas Obtenidas de la Variable Continua
Histograma CONTINUA
Histogram of CONTINUA
7
7
6
6
5
5
Frecuencia
4
Frequency
3
3
2
2
1
1
0
0
0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
0.5 1.0 1.5 2.0 2.5 3.0 3.5
CONTINUA
CONTINUA
Podemos deducir que los datos producidos en el diagrama de barras, con la regla de sturges, no
presentan correctamente los datos; Debido a que esto se hace con referencia a la tabla de
frecuencias, por lo tanto, en el diagrama sin la regla de sturges los datos son mas precisos. Siendo
esto lo que los hace diferentes.
Boxplot CONTINUA
3.5
3.0
unidad de medida
2.5
2.0
1.5
1.0
0.5
En este diagrama de cajas podemos observar datos como la media, los 3 cuantiles y rango de
datos; En concordancia a los 30 arboles de cacao escogidos para la practica. De este modo nos
permite deducir la minima, maxima y media de la produccion diaria de cada Planta de cacao.
VARIABLE CUANTITATIVA DISCRETA.
Resultado obtenidos.
Summary(DISCRETA) # Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.00 9.25 12.00 12.07 14.50 20.00
Min(DISCRETA)# Mínimo
[1] 7
Max(DISCRETA) # Máximo
[1] 20
Range(DISCRETA) # Rango
[1] 7 20
Mean(DISCRETA) # Media aritmética
[1] 12.06667
Median(DISCRETA)# Mediana
[1] 12
Length(DISCRETA)# Número de datos
[1] 30
Sd(DISCRETA)# Desviación estándar
[1] 3.551914
Quantile(DISCRETA, 0.25) # Cuantil Q1
25%
9.25
Quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
50%
12
Quantile(DISCRETA, 0.75) # Cuantil Q3
75%
14.5
IQR(DISCRETA)# Rango intercuartílico
[1] 5.25
Sort(DISCRETA)# Ordenar
[1] 7 7 8 8 8 9 9 9 10 10 10 10 11 11 12 12 12 12 12 13 13 13 15 15 16
[26] 17 17 18 18 20
Graficas Obtenidas de la Variable Discreta.
Diagrama de barras Frecuencia Absoluta DISCRETA
5
4
Frecuencias Absolutas
3
2
1
0
7 8 9 10 11 12 13 15 16 17 18 20
En las frecuencias absolutas nos permiten mostrar el número de veces que se repite un dato en
dicha actividad. De esta manera nos permite identificar en las siguientes graficas los resultados
de la cantidad de frutos de cacao, que posee cada árbol donde nos indica que:
• 2 árboles poseen 7 frutos.
• 3 árboles poseen 8 frutos.
• 2 árboles poseen 9 frutos.
• 4 árboles poseen 10 frutos.
• 2 árboles poseen 11 frutos.
• 5 árboles poseen 12 frutos.
• 3 árboles poseen 13 frutos.
• 2 árboles poseen 15 frutos.
• 1 árbol posee 16 frutos.
• 2 árboles poseen 17 frutos.
• 2 árboles poseen 18 frutos.
• 1 árbol posee 20 frutos.
Diagrama de barras Frecuencia Relativa DISCRETA
0.15
Frecuencia Relativa
0.10
0.05
0.00
7 8 9 10 11 12 13 15 16 17 18 20
Podemos observar un gráfico de la frecuencia relativa, en la que nos indica la cantidad de frutos de
cacao, con sus respetivas plantas en términos de 0 a 1. La cual se obtiene, dividiendo la frecuencia
absoluta sobre el total de la muestra.
Por lo tanto, para pasarla a porcentajes la multiplicamos por 100:
Ejemplo:
0.06666667 * 100=6,7 % Nos indica que de 30 árboles de cacao el 6,7% tienen 7 frutos y así se
hace sucesivamente con los demás datos.
Diagrama de barras Frecuencia Absoluta Acumulada DISCRETA
30
25
Frecuencia Absoluta Acumulada
20
15
10
5
0
7 8 9 10 11 12 13 15 16 17 18 20
En este diagrama de barras nos permite observar el acumulado o suma de las frecuencias
absolutas, indicando cuantos frutos de cacao se van contando hasta ese momento o cuántos se van
reportando, en un orden de menor a mayor. Siendo así la forma en la que podemos determinar la
cantidad mínima y máxima de frutos de cacao, que posee un árbol.
Diagrama de barras Frecuencia Relativa Acumulada DISCRETA
1.0
0.8
Frecuencia Relativa Acumulada
0.6
0.4
0.2
0.0
7 8 9 10 11 12 13 15 16 17 18 20
Esta grafica corresponde a la frecuencia relativa acumulada, la cual se obtiene dividiendo la
frecuencia absoluta sobre el total de la muestra; presentando los datos en términos de 0 a 1. Por
consiguiente, nos permite identificar, la menor y mayor cantidad de frutos de cacao que posee un
árbol.
20
18
16
14
12
10
8
Este grafico es de gran importancia porque podemos evidenciar mucha información como lo es
la mediana, los 3 cuantiles y rango. Por lo tanto, nos permite deducir la cantidad mínima, media y
máxima de frutos, en los árboles de cacao.
Grafico de tarta Frecuencia Absoulta DISCRETA
9
10
8
11
7
20
12
18
17
13 16
15
En esta grafica se puede observar, la división de un gráfico de tarta en porciones, en la que nos
indica la cantidad de frutos; En relación con los árboles de cacao, de modo que a cada porción le
corresponde un arco de circulo proporcional a su frecuencia absoluta.
VARIABLE CUALITATIVA O CATEGORICA
Muestra cada dato con el nombre del nivel de la categoría que se asignó previamente
[1] Sin Daño Daño Medio Daño Medio Sin Daño Sin Daño Daño Alto
[7] Sin Daño Daño Bajo Sin Daño Daño Medio Sin Daño Sin Daño
[13] Sin Daño Daño Medio Daño Bajo Daño Medio Sin Daño Daño Bajo
[19] Sin Daño Daño Bajo Sin Daño Sin Daño Daño Bajo Daño Alto
[25] Sin Daño Sin Daño Sin Daño Daño Medio Sin Daño Daño Alto
Levels: Sin Daño Daño Bajo Daño Medio Daño Alto
Hacer un resumen del número de individuos que pertenecen a cada una de las categorías
asignadas
Sin Daño Daño Bajo Daño Medio Daño Alto
16 5 6 3
Tabla de frecuencias absolutas
CATEGORICA
Sin Daño Daño Bajo Daño Medio Daño Alto
16 5 6 3
Indicar la frecuencia de cada nivel en términos de porcentaje (multiplicar por 100)
CATEGORICA
Sin Daño Daño Bajo Daño Medio Daño Alto
0.5333333 0.1666667 0.2000000 0.1000000
Gráficos Obtenidos de la variable Cualitativa o Categórica.
En esta grafica podemos analizar la cantidad de árboles de cacao que tenemos por cada estado de
Daño, donde nos indica que:
• 16 árboles de cacao se presentan “Sin Daño”
• 5 árboles de cacao se presentan con “daño Bajo”
• 6 árboles de cacao se presentan con “daño Medio”
• 3 árboles de cacao se presentan con “daño Alto”
En esta grafica podemos observar la cantidad de árboles de cacao que tenemos por cada estado de
Daño, en términos de 0 y 1.
Ahora lo que tenemos que hacer es multiplicar por 100, para obtener los porcentajes, los cuales
nos indican que:
• 0.5333333 *100=53% de los 30 árboles de cacao se encuentran “sin Daño”
• 0.1666667 *100=17% de los 30 árboles de cacao se encuentran en “Daño Bajo”
• 0.2000000 *100=20% de los 30 árboles de cacao se encuentran en “Daño Medio”
• 0.1000000 *100=10% de los 30 árboles de cacao se encuentran en “Daño Alto”
CONCLUSIONES.