Estudiante: Alvaro Gallardo Fernández, MBA USM, casa central Valparaíso
1. ¿Qué función usaría para mostrar el directorio en su computadora que R está usando como
directorio de trabajo?
En R, puedes usar la función getwd() para obtener el directorio de trabajo actual. Este directorio es
el lugar en el sistema de archivos desde el cual R está buscando y escribiendo archivos por defecto, a
menos que se especifique lo contrario. Para mostrar el directorio de trabajo actual, simplemente
ejecuta getwd(). Esto imprimirá el directorio de trabajo actual en la consola de R.
2. ¿Qué función usaría para enumerar todas las variables (“objetos”) que están definidas en su
espacio de trabajo de R?
En R, puedes usar la función ls() para listar todas las variables (objetos) que están definidas en tu
espacio de trabajo actual. Esto te mostrará los nombres de todas las variables que has definido hasta
el momento. Al ejecutar esta función, verás una lista de todas las variables definidas en tu sesión de
R en ese momento.
3. ¿Qué función usaría para configurar su directorio de trabajo de R en un directorio diferente?
Para configurar el directorio de trabajo en R en un directorio diferente, puedes usar la función
setwd(). Esta función te permite especificar la ubicación del nuevo directorio que deseas usar como
directorio de trabajo. Ejemplo: Reemplaza "/ruta/al/nuevo/directorio" con la ruta completa del
directorio al que deseas cambiar. Después de ejecutar esta función, el directorio especificado se
convertirá en tu nuevo directorio de trabajo en R. Es importante tener en cuenta que debes
proporcionar la ruta correcta al directorio que deseas usar.
4. Escribe una función R para crear un vector que consta de los números enteros del 1 al 5
repetidos 50 veces: 1,2,3,4,5,1,2,3,4,5,1,2,3,4,5 , ...
Puedes crear un vector con los números enteros del 1 al 5 repetidos 50 veces utilizando la función
rep(). Aquí tienes una función en R que hace eso:
Esta función crea un vector que contiene los números enteros del 1 al 5 repetidos 50 veces cada uno.
Puedes cambiar el número 50 por cualquier otro valor si deseas que se repitan más o menos veces.
5. ¿Cuál es el nombre de la clase R que tiene filas y columnas, y es la clase predeterminada que R
usa al leer archivos con funciones como read.csv() o read.table()?
La clase R que tiene filas y columnas y es la clase predeterminada que R usa al leer archivos con
funciones como read.csv() o read.table() es data.frame. El data.frame es una estructura de datos
tabular que organiza los datos en filas y columnas, similar a una tabla en una base de datos o una
hoja de cálculo. Es una de las estructuras de datos más comunes y versátiles en R para manipular
datos tabulares.
6. ¿Qué función usarías para ver cuántas filas tienen tus datos?
Para ver cuántas filas tiene un conjunto de datos en R, puedes usar la función nrow(). Esta función
devuelve el número de filas en un objeto de datos, ya sea un data.frame, una matriz u otro objeto
similar. Aquí tienes un ejemplo de cómo usar nrow():
Reemplaza 'datos' con el nombre de tu conjunto de datos. Al ejecutar esta función, obtendrás el
número de filas en tus datos.
7. ¿Qué función usarías para ver las primeras filas de tus datos?
Para ver las primeras filas de tus datos en R, puedes usar la función head(). Esta función te muestra
las primeras filas de un objeto de datos, por defecto, las primeras 6 filas. Es útil para obtener una
vista previa rápida de tus datos. Aquí tienes un ejemplo de cómo usar head():
Al ejecutar este código, se imprimirán las primeras filas de tu conjunto de datos. Si deseas ver más o
menos filas, puedes especificar el número de filas que deseas mostrar como argumento opcional en
la función head(). Por ejemplo, head(datos, 10) mostrará las primeras 10 filas de tus datos.
8. ¿Qué hace la función resumen ()?
La función summary() en R proporciona un resumen estadístico de los datos en un objeto. El
resumen que proporciona varía dependiendo del tipo de objeto que se pasa como argumento. Para
un data.frame, por ejemplo, summary() mostrará estadísticas resumidas para cada una de las
variables en el conjunto de datos.
El resumen que devuelve summary() incluye:
Para variables numéricas, proporciona el mínimo, el primer cuartil, la mediana, la media, el
tercer cuartil y el máximo.
Para variables categóricas o factores, muestra la frecuencia de cada categoría.
Para otros tipos de datos, proporciona información relevante como el número de valores
faltantes.
En resumen, summary() es una función muy útil para obtener una visión general de tus datos,
especialmente cuando estás explorando un nuevo conjunto de datos y deseas comprender
rápidamente su distribución y características principales.
9. ¿Qué hace la función str()?
La función str() en R proporciona una descripción compacta de la estructura de un objeto en R. "str"
es una abreviatura de "structure".
Cuando aplicas str() a un objeto, obtienes información sobre la estructura del objeto, incluidos los
tipos de datos de sus componentes y una vista previa de los primeros elementos. Esta función es
especialmente útil cuando trabajas con objetos complejos como data.frame, listas u otros objetos
anidados.
El resultado de str() incluye detalles como:
El tipo de objeto.
La cantidad de elementos en el objeto (si es una lista o un vector).
La estructura interna de un data.frame, incluyendo el nombre de las variables, sus tipos de
datos y una vista previa de las primeras observaciones.
Para listas, muestra la estructura interna de cada elemento de la lista.
str() es una herramienta esencial para explorar la estructura de tus datos y comprender cómo están
organizados, lo que puede ser crucial al realizar análisis de datos y manipulaciones.
10. ¿Qué funciones gráficas básicas se utilizan para crear un diagrama de dispersión?
Para crear un diagrama de dispersión en R, puedes utilizar varias funciones gráficas básicas, pero las
dos funciones más comunes son plot() y ggplot2::ggplot().
a) plot(): Esta es una función base de R que se utiliza para crear gráficos básicos. Se puede usar
para crear un diagrama de dispersión simple. Aquí hay un ejemplo:
Donde x y y son los vectores que representan las coordenadas x e y de tus puntos de datos,
respectivamente.
b) ggplot(): Esta función pertenece al paquete ggplot2, que proporciona un enfoque más flexible y
poderoso para la creación de gráficos en R. Aquí hay un ejemplo de cómo crear un diagrama de
dispersión con ggplot2:
Donde datos es tu conjunto de datos, variable_x y variable_y son los nombres de las columnas
que representan tus variables x e y, respectivamente.
Estas son las dos funciones más comunes para crear diagramas de dispersión en R, pero hay
muchas otras funciones y paquetes disponibles que pueden proporcionar más opciones y
personalización en tus gráficos, dependiendo de tus necesidades específicas.
11. ¿Qué parámetros usarías para etiquetar los ejes xey de un gráfico?
Tanto la función plot() como la función ggplot() te permiten etiquetar los ejes x e y de un gráfico
en R.
a) Con la función plot():
Para etiquetar los ejes x e y con la función plot(), puedes utilizar los parámetros xlab y ylab para
especificar las etiquetas de los ejes x e y, respectivamente. Aquí tienes un ejemplo:
Donde "Etiqueta del eje x" y "Etiqueta del eje y" son los textos que deseas utilizar como
etiquetas en los ejes x e y, respectivamente.
b) Con la función ggplot():
Para etiquetar los ejes x e y con la función ggplot(), puedes utilizar las funciones labs() o xlab() y
ylab() dentro de la función ggplot() para especificar las etiquetas de los ejes x e y,
respectivamente. Aquí tienes un ejemplo:
Donde "Etiqueta del eje x" y "Etiqueta del eje y" son los textos que deseas utilizar como
etiquetas en los ejes x e y, respectivamente.
Con cualquiera de estas opciones, puedes personalizar las etiquetas de los ejes x e y según tus
necesidades.
12. Copie y pegue en su documento el diagrama de dispersión producido a partir de los datos de los
automóviles que traza los puntos como triángulos (puede copiar y pegar como mapa de bits o
metarchivo directamente desde la ventana de gráficos de R)
generar un diagrama de dispersión utilizando ggplot2 en R y luego puedes ejecutar el código en
tu entorno R para ver el gráfico.
Este código generará un diagrama de dispersión de los datos de automóviles, donde los puntos
se representarán como triángulos. Puedes ejecutar este código en tu entorno R y ver el gráfico
resultante. Si deseas copiar y pegar el gráfico como un mapa de bits o metarchivo, generalmente
puedes hacerlo desde la ventana gráfica de tu entorno R después de ejecutar el código.
13. ¿Qué función usarías para crear un diagrama de caja?
Para crear un diagrama de caja en R, puedes utilizar la función boxplot(). Esta función está
incluida en el conjunto de funciones gráficas base de R y se utiliza para representar gráficamente
la distribución de un conjunto de datos a través de sus cuartiles. Aquí tienes un ejemplo básico
de cómo usar boxplot():
Donde datos es el vector, matriz o data frame que contiene los datos que deseas representar en
el diagrama de caja. Puedes personalizar el título y las etiquetas de los ejes según tus
preferencias.
También puedes utilizar boxplot() para crear diagramas de caja de múltiples variables al pasar un
data frame con múltiples columnas como argumento. En este caso, cada columna se
representará como una caja en el diagrama.
14. ¿Qué función usarías para crear un histograma?
Para crear un histograma en R, puedes utilizar la función hist(). Esta función está incluida en el
conjunto de funciones gráficas base de R y se utiliza para representar la distribución de una
variable numérica en forma de un histograma. Aquí tienes un ejemplo básico de cómo usar
hist():
Donde datos es el vector, matriz o data frame que contiene los datos que deseas representar en
el histograma. Puedes personalizar el título y las etiquetas de los ejes según tus preferencias.
Además, la función hist() tiene varios argumentos opcionales que te permiten personalizar la
apariencia del histograma, como el número de intervalos (breaks), el color de las barras (col), el
tipo de línea (lty), entre otros. Puedes consultar la documentación de la función hist() para
obtener más detalles sobre cómo usar estos argumentos.
15. ¿Cuál es la URL de la página web recomendada para explorar otros elementos de los gráficos
básicos?
Una excelente página web recomendada para explorar otros elementos de los gráficos básicos
en R es la documentación oficial de R, específicamente la sección dedicada a las funciones
gráficas base:
Documentación oficial de R - Funciones gráficas base
Esta documentación proporciona información detallada sobre las funciones gráficas básicas de R,
incluyendo plot(), hist(), boxplot(), barplot(), entre otras. Además, encontrarás ejemplos
prácticos, explicaciones detalladas y ejercicios que te ayudarán a comprender cómo utilizar estas
funciones para crear gráficos efectivos en R.
Otra fuente útil para aprender sobre gráficos en R es el libro "R Graphics Cookbook" de Winston
Chang, que proporciona una amplia gama de recetas y ejemplos para crear una variedad de
gráficos utilizando diferentes paquetes gráficos en R. Puedes encontrar más información sobre
este libro aquí: R Graphics Cookbook