300046_94
ELABORADO POR:
ANGIE TATIANA BRIÑEZ
ID 1110528735
PRESENTADO AL TUTOR:
ISMAEL DUSSAN
DIRECTOR DE CURSO
LUIS ALBERTO CACERES
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)
ABRIL DE 2020
Introducción
Diariamente en los estudios que se realizan, se encuentra una cantidad de información
que necesita ser procesada por medio de estudios probabilísticos. Con el desarrollo de
este proyecto se pretende dar solución a información real, que se va a organizar,
diagramar y posteriormente procesar con el programa R para poder predecir y poder
tomar decisiones importantes en las diferentes áreas de estudio.
Objetivo general
Ejecutar el programa R en un proyecto agropecuario real
Objetivos específicos
Establecer los datos que van a ser procesados
Procesar la información en el programa R para poder obtener tablas de
frecuencia, gráficas y modelos probabilísticos
Analizar los resultados y sacar conclusiones
DESARROLLO DE LA ACTIVIDAD INDIVIDUAL
Identificación de las variables:
Sacrificio de ganado ovino, peso en pie y peso en canal por categorías desde
2015 a 2019 (cuantitativa discreta) TOTAL CABEZAS DE GANADO OVINO
https://https://www.dane.gov.co/index.php/estadisticas-por-tema/agropecuario/
encuesta-de-sacrificio-de-ganado
Sacrificio de ganado ovino, peso en pie y peso en canal por categorías desde
2015 a 2019 (cuantitativa continua) TOTAL PESO EN KILOS
https://www.3tres3.com/cotizaciones-de-porcino/colombia_148/
Hogares con mascotas en Colombia https://www.larepublica.co/consumo/seis-
de-cada-10-hogares-del-pais-tienen-mascota-segun-brandstrat-2829114
DATOS:
KILOS CABEZAS MASCOTA
1 100.224 2.376 SI
2 102.354 2.436 SI
3 132.977 3.260 SI
4 126.249 3.048 NO
5 119.180 3.136 SI
6 128.571 3.264 NO
7 116.744 2.999 NO
8 109.302 2.868 SI
9 122.722 3.226 SI
10 120.082 3.128 SI
11 109.213 2.841 NO
12 125.595 3.248 SI
13 92.533 2.762 SI
14 103.144 3.187 NO
15 113.689 3.580 SI
16 120.773 3.848 SI
17 119.299 3.758 SI
18 119.339 3.684 SI
19 124.067 3.759 SI
20 143.931 4.330 NO
21 123.233 2.543 SI
22 119.459 2.823 NO
23 117.298 2.634 SI
24 120.634 2.943 SI
25 120.983 3.421 NO
26 122.825 3.248 NO
27 125.769 3.326 NO
28 123.498 3.347 NO
29 121.634 3.721 SI
30 123.534 3.756 SI
CUADRO RESUMEN CON LOS RESULTADOS OBTENIDOS
Histogram of CONTINUA
15
Gráficos de tabla de frecuencia
Frequency
10
5
Como vemos la gráfica el intervalo que más
se repite es el de 120.000 a 130.000 kilos de
0
100000 110000 120000 130000 140000
carne de ganado ovino
CONTINUA
Histogram of CONTINUA
15
10
Frequency
5
0
90000 100000 110000 120000 130000 140000 150000
CONTINUA
Boxplot CONTINUA
100000 110000 120000 130000 140000
Los laterales representan el valor minimo y
unidad de medida
máximo de los datos suministrados en este
caso : 92533 -143931. La línea de la mitad
con negrita representa el valor de la media
120704 y las cajas de los lados representan
Q1 Y Q3
VARIABLE CUANTITATIVA DISCRETA
Diagrama de barras Frecuencia Absoluta DISCRETA Diagrama de barras Frecuencia Relativa DISCRETA
2.0
0.06
0.05
1.5
Frecuencias Absolutas
Frecuencia Relativa
0.04
1.0
0.03
0.02
0.5
0.01
0.00
0.0
2376 2762 2943 3136 3260 3421 3756 4330 2376 2762 2943 3136 3260 3421 3756 4330
Diagrama de barras Frecuencia Relativa Acumulada DISCRETA
Diagrama de barras Frecuencia Absoluta Acumulada DISCRETA
1.0
30
25
0.8
Frecuencia Relativa Acumulada
Frecuencia Absoluta Acumulada
20
0.6
15
0.4
10
0.2
5
0.0
0
2376 2762 2943 3136 3260 3421 3756 4330 2376 2762 2943 3136 3260 3421 3756 4330
Al tener un solo dato por numero vemos como las gráficas muestran un aumento
equivalente a uno en cada valor que toma hasta llegar al dato 30. En la gráfica relativa
acumulada, vamos viendo el mismo comportamiento hasta que llega a 1, que equivale
al 100%.
Grafico de BoxPlot de variable continua
4000
Los laterales representan el valor minimo y
máximo de los datos suministrados en este
3500
caso : 2376 y 4330. La línea de la mitad con
negrita representa el valor de la media 3237
y las cajas de los lados representan Q1 Y
3000
Q3= 2886 y 3540
2500
Grafico de tarta Frecuencia Absoulta DISCRETA
2943 28682841
2999 2823
3048 2762
3128 2634
3136 2543
3187 2436
3226 2376
4330
3248
3848
3260 3759
3264 3758
3326 3756
3347 3721
34213580 3684
En la grafica de torta podemos ver que al tener un solo dato por cada valor, hay 30
divisiones en la torta.
VARIABLE CUALITATIVA O CATEGORICA
Diagrama de Barras Frecuencia Absoluta CATEGORICA
GRÁFICOS DE VARIABLES
CUALITATIVAS
15
Frecuencias absolutas
10
5
0
CON MASCOTA SIN MASCOTA
Representación grafica de la
información organizada en las tablas
de frecuencia. Según los resultados
podemos observar como 19 familias
Diagrama de barras Frecuencia Relativa CATEGORICA tienen mascota y 11 no tienen. En la
gráfica de Frecuencia relativa se
representa con porcentaje 0.63 o 63%
0.6
y 0.36 o 36%.
0.5
Frecuencias relativas
0.4
0.3
0.2
0.1
0.0
CON MASCOTA SIN MASCOTA
CONCLUSIONES
Poder desarrollar un ejercicio práctico con datos reales, mejora la manera de
apropiarnos del conocimiento. El hecho de buscar los datos, organizarlos y
plasmarlos permite la resolución de interrogantes que solo pueden ser
despejados al solucionar un ejercicio de este nivel. Poder trabajar con el
programa R, nos facilita el trabajo de resultados estadístico y nos permite
mejorar nuestras presentaciones a través de datos y graficos relacionados con la
información procesada.
BIBLIOGRAFÍA
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en
problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=322177
5&query=bioestadística
Di, R. J. A., Casanoves, F., & Gonzalez, L. A. (2008). Estadística para las
ciencias
agropecuarias (7a. ed.). Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?ppg=1&docID=
3185731&tm=1519912328994
Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad
Nacional
de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/. Licencia:
Creative Commons BY-NC-ND.
ANEXO CODIGO
# CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA DESCRIPTIVA
(300046A_614)
# PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE ARRIBA HACIA
ABAJO
# VARIABLE CUANTITATIVA CONTINUA
# Ejemplos: peso (de animales, de cosechas, etc.), contenidos de nutrientes en el suelo
(ppm), pH, edad, material particulado, etc.
# En el siguiente renglón reemplace y digite los 30 datos de su variable CONTINUA,
separándolos con comas. Para números decimales use punto:
CONTINUA=c(100224,102354,132977,126249,119180,128571,116744,109302,122722
,120082,109213,125595,92533,103144,113689,120773,119299,119339,124067,14393
1,123233,119459,117298,120634,120983,122825,125769,123498,121634,123534)
# RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
summary(CONTINUA)# Resumen estadístico
mean(CONTINUA)#media aritmética
var(CONTINUA)#varianza
sd(CONTINUA)#desviación estándar
min(CONTINUA) #Mínimo
max(CONTINUA)# Máximo
range(CONTINUA) #Rango
median(CONTINUA)# Mediana
length(CONTINUA)# Número de datos
quantile(CONTINUA, 0.25)# Cuantil Q1
quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
quantile(CONTINUA, 0.75)# Cuantil Q3
IQR(CONTINUA) #Rango intercuartílico
sort(CONTINUA)# Ordenar
# TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON
REGLA DE STURGES
# La regla de Sturges define el número de rangos para organizar la tabla de
frecuencias:
range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la
presencia de valores perdidos
nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la
frecuencia de la variable (en este caso, 6 intervalos)
seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) # Límites
de los intervalos
intervalosCONTINUA=cut(CONTINUA,breaks=seq(min(CONTINUA),max(CONTINUA),l
ength=nclass.Sturges(min(CONTINUA))),include.lowest=TRUE)
intervalosCONTINUA# Se muestran los intervalos de edad, uno correspondiente a cada
edad observada
puntos=min(CONTINUA)+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/nclass.Sturges(CONTINUA)
hist(CONTINUA, breaks=puntos)# histograma de frecuencias usando la regla de
Sturges
# Instalación de la libreria agrícolae (permite el uso de otras herramientas estadísticas):
# En "Secure CRAN mirrors", seleccionar: "USA(IA)"
#Tener paciencia, ya que la instalación puede tomar varios minutos
#Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte inferior de la
consola R
install.packages("agricolae")
library(agricolae) # si la libreria se instaló correctamente, al dar CONTROL+R se pone
Rojo
# TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:
# Existen dos comandos que generan la misma tabla de frecuencia o histograma:
# Gráficos de tabla de frecuencia:
tbFreqCONTINUA=table.freq(hist(CONTINUA,plot=TRUE))
hist(CONTINUA,ylab="Frecuencia",main="Histograma CONTINUA")#Histograma
# Tabla de frecuencia:
tbFreqCONTINUA
# Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro cuartiles):
boxplot(CONTINUA,ylab="unidad de medida",main="Boxplot CONTINUA")#Gráficos de
cajas
# VARIABLE CUANTITATIVA DISCRETA
# Son variables de conteo, como número de personas que habitan un predio, número
de crías por parto, número de frutos por cosecha, etc.
# En el siguiente renglón, reemplace y digite los 30 datos de su variable DISCRETA,
separándolos con comas:
DISCRETA=c(2376,2436,3260,3048,3136,3264,2999,2868,3226,3128,2841,3248,2762
,3187,3580,3848,3758,3684,3759,4330,2543,2823,2634,2943,3421,3248,3326,3347,37
21,3756)
# RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
summary(DISCRETA) # Resumen estadístico
min(DISCRETA) # Mínimo
max(DISCRETA) # Máximo
range(DISCRETA) # Rango
mean(DISCRETA) # Media aritmética
median(DISCRETA) # Mediana
length(DISCRETA) # Número de datos
sd(DISCRETA) # Desviación standar
quantile(DISCRETA, 0.25) # Cuantil Q1
quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
quantile(DISCRETA, 0.75) # Cuantil Q3
IQR(DISCRETA) # Rango intercuartílico
sort(DISCRETA) # Ordenar
# Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:
FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta" para la
Tabla de frecuencias absolutas de la variable discreta
FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre de
"FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la variable
discreta
FrAbsAcumDiscreta #Frecuencias absolutas acumuladas
FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de
"FrRelDiscreta" para la Tabla de frecuencias relativas de la variable discreta
FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0 a 1 y
para pasarla a porcentaje se multiplica por 100
FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas
acumuladas
FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100
# GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA
VARIABLE DISCRETA:
barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="Diagrama de barras
Frecuencia Absoluta DISCRETA")
barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="Diagrama de barras
Frecuencia Relativa DISCRETA")
barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta Acumulada",main="Diagrama
de barras Frecuencia Absoluta Acumulada DISCRETA")
barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa Acumulada",main="Diagrama de
barras Frecuencia Relativa Acumulada DISCRETA")
# Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los datos
en los cuatro cuartiles):
boxplot(DISCRETA)
# GRÁFICO DE TORTA PARA VARIABLE DISCRETA:
pie(FrAbsDiscreta,col=rainbow(6),main=c("Grafico de tarta Frecuencia Absoulta
DISCRETA")) # Gráfico de tarta
# VARIABLE CUALITATIVA O CATEGÓRICA
# Son atributos no numéricos, como el nivel de estudios de una persona, el nivel de
ingreso, o el grado de ataque de un patógeno.
# Para poder analizarlos es necesario codificarlos
# Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los agricultores
de un municipio, se pueden asignar cuatro niveles:
# 1= sin estudio, 2= primaria, 3= secundaria y 4= universidad
# CATEGORICA = Nivel de estudio de agricultores
# En el siguiente renglón, reemplace y digite los 30 datos de su variable CUALITATIVA
o CATEGÓRICA, separándolos con comas:
CATEGORICA=c(1,1,1,2,1,2,2,1,1,1,2,1,1,2,1,1,1,1,1,2,1,2,1,1,2,2,2,2,1,1)
# Es necesario aclararle al programa que cada número es una categoría:
# En el siguiente comando reemplace de acuerdo al número de niveles que tenga su
variable categórica:
CATEGORICA=factor(CATEGORICA, levels=c(1,2),
# A continuación, indique el nombre de cada categoría:
# reemplace las palabras entre comillas, indicando el nombre de cada nivel de su
variable:
labels=c("CON MASCOTA","SIN MASCOTA") )
CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que se
asignó previamente
summary(CATEGORICA) # Hace un resumen del número de individuos que
pertenecen a cada una de las categorías asignadas
table(CATEGORICA) #Tabla de frecuencias absolutas
# Al asignar nombres a los comandos, no se deben repetir los que se usaron
previamente:
FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de "FrAbsCategorica"
para la Tabla de frecuencia absoluta de la variable categórica o cualitativa
FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable categórica
FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de
"FrRelCategorica" para la Tabla de frecuencia relativa de la variable categorica o
cualitativa
FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje
(multiplicar por 100)
# GRÁFICOS DE VARIABLES CUALITATIVAS:
barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de Barras
Frecuencia Absoluta CATEGORICA") # Diagrama de barras (frecuencia absoluta) para
cada nivel de estudios
barplot(FrRelCategorica,ylab="Frecuencias relativas",main="Diagrama de barras
Frecuencia Relativa CATEGORICA") # Diagrama de barras (frecuencia relativa) para
cada nivel de estudios
# Luis Alberto Cáceres
# Director de curso
# Estadística Descriptiva (para agrarias)