Variables numéricas
Actividad echa en R estudio.
#paquetes de R
[Link]("vcd")
library(vcd)
[Link]("fdth")
library(fdth)
#converitr la base en una data frame
Base<- [Link](X2_8_Base)
#Nombrar variables
X<- Base$Carrera
y<- Base$`Color preferido`
#Elaborar tabla de contigencia
[Link]<- table(X, y)
ftable([Link])
#tabla de perfiles
[Link]([Link])
#tabla perfiles fila
[Link]([Link], 1)
#tabla perfiles columna
[Link]([Link], 2)
#otra forma de visualizar la tabla perfiles columna
ftable([Link]([Link], 2))
# Elaborar distribucion de frecuencias
dist = fdt(Base$Edad, start = 18, end = 23, h = 0.84)
dist
#Histogramas (FA y FR)
plot(dist, type = "fh")
plot(dist, type = "rfh")
#poligono de frecuencias (FA y FR)
plot(dist, type = "fp")
plot(dist, type = "rfp")
#ojiva ascendente o curva de frecuencia acumulada (FA y FR)
plot(dist, type = "cfpp")
plot(dist, type = "cfp")
# converitr la base en una data frame
ventas<- [Link](Archivo_3_4_base_ventas_oficina_)
#elaborar distribucion de frecuencias
dist = fdt(ventas$`Valor de la venta`, start = 1282500, end = 7075000, h = 827358)
dist
#histograma (FA)
plot(dist, type = "fh")
Datos Categoricos
# Paquetes de R
[Link]("ggplot2")
library(ggplot2)
[Link]("RCCPCA")
#PONER UN NOMBRE SIMPLE A LA BASE DE DATOS DE LA DATA Frame
base<- [Link](X2_8_Base)
#Tabla de datos
[Link](table(base$[Link]))
# Convertir la tabla en data frame
tabla_color<- [Link](table(base$[Link]))
#tabla de datos completa
transform(tabla_color,
FAA= cumsum(tabla_color$Freq),
FR= round([Link](tabla_color$Freq),3),
FRA= round(cumsum([Link](tabla_color$Freq)),3))
# Convertir la tabla en data frame
tabla_carrera<- [Link](table(base$Carrera))
#tabla de datos completa
transform(tabla_carrera,
FAA= cumsum(tabla_carrera$Freq),
FR= round([Link](tabla_carrera$Freq),3),
FRA= round(cumsum([Link](tabla_carrera$Freq)),3))
#Grafico de barras para categorica
barplot(table(base$[Link]), xlab = "color", ylab = "Frecuencia", col = "blue")
color <- [Link](categories = c("Azul", "Negro", "Rojo", "Rosado", "Morado", "Blanco",
"Vinotinto", "Verde", "Amarillo", "Naranja"), values = c(13, 9, 5, 5, 5, 4, 2, 2, 1, 1))
#Grafico de pastel
ggplot(color, aes(x = "", y = values, fill = categories)) +
geom_bar(width = 1, stat = "identity") +
coord_polar("y", start = 0)
#Gráfica de barras horizontales
barplot(table(base$[Link]), horiz = TRUE, xlab = "Frecuencia", ylab = "Colores", col =
"blue")
library(ggplot2)
ggplot(color, aes(x = categories, y = values)) +
geom_bar(stat = "identity", position = "dodge", width = .5, color = "black") +
coord_flip()
Tabla dinamica
Pasos:
1. Insertar table dinámica de la base de datos
2. Realizar la tabla de acuerdo a lo que nos pidan ( se pone la variable en el cuadro
que dice filas y el otro en valores). Eso se va a llamar la frecuencia absoluta
3. Realizar la frecuencia Relativa(FR), esto se hace dividendo el valor de cada ítem
sobre el valor total de todos los ítem. Importante Poner los valores en porcentaje y
dejar dos decimales
4. Realizar la frecuencia absoluta acumulada (FAA), Esto se hace sumando cada valor
del ítem con el valor que le sigue.
5. Realizar la frecuencia relativa acumulada (FRA), esto se hace sumando la
frecuencia relativa (cada ítem con el que sigue). Siempre va en porcentaje
6. Realizar grafico de barras, esto se hace copiando y pegando la parte de la tabla
como valores y después volviéndola tabla dinámica y ahí si se saca el grafico.
7. Realizar grafico de columnas , esto se hace copiando y pegando la parte de la tabla
como valores y después volviéndola tabla dinámica y ahí si se saca el grafico.
8. Grafico de pastel se hace así
9. Cuando me piden que
Construya la tabla de
distribución de frecuencias, es solo sacar la frecuencia relativa acumulada y la
frecuencia absoluta acumulada.(lo hice desde la tabla inicial).
AL momento de analizar
1. La frecuencia relativa se puede deducir esto.
2. Para la frecuencia relativa se puede decir esto.
3. Para la frecuencia absoluta acumulada se puede decir esto.
Actividad ultima clase
Como se hayan las cosas:
- Número de observaciones se haya con la función (Contar)
- El valor máximo se haya con la función (MAX) y el mínimo con la función (MIN) y
esto se hace sobre todos los valores de las ventas.
- El # de clases se haya así. ( se tiene que aproximar a un número más grande ).
- La amplitud se haya asi. ( Se tiene que poner un número más grande para que
pueda dar).
- El promedio se haya con la función (promedio).
EL primer cuadrado se haya asi:
- (Li)- el primer valor es el mínimo , pero después se va poniendo el valor del (LS).
- (Ls) – Se suma el (Li) y se multiplica con la amplitud. Importante fija la amplitud
pero los valores de (Li) se van corriendo.
- (Xi)- Se va corriendo cada cuadrito hacia abajo
- EL (Ni) – es la misma formula para todos los cuadritos , se haya con la funcion
(Frecuencia).
- El resto de cosas se hayan normal como lo explique al principio (FAA), (FR) y (FRA).
- El (Xi)(Ni) se hayan asi.
- La media para datos agrupados se saca así:
- La media se saca asi:
- La mediana se saca con la función (Mediana) y se coge todos los datos de valor de
la venta. Así como la media.
- La moda se saca con la función (Moda) y se coge todos los datos de valor de la
venta. Así como la media.
- El rango – es la resta entre el máximo y mínimo.
- Varianza se saca con la función (VAR.S)
- Desviación Estándar o típica – ( se puede hallar de cualquiera de las dos maneras).
- Coeficiente de variación se saca así.