0% encontró este documento útil (0 votos)
34 vistas71 páginas

Introducción a R y GitHub en RStudio

Tools for the Data Science - Week 5
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas71 páginas

Introducción a R y GitHub en RStudio

Tools for the Data Science - Week 5
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

RStudio y GitHub [Semana 5]

R es un lenguaje de programación estadística y es una potente herramienta para el procesamiento y la manipulación de


datos. Este módulo comenzará con una introducción a R y RStudio. Conocerá los diferentes paquetes de visualización
de R y cómo crear gráficos visuales utilizando la función de trazado. Además, los sistemas de control de versiones
distribuidos (DVCS) se han convertido en herramientas fundamentales en el desarrollo de software y en facilitadores
clave para la codificación social y colaborativa. Aunque existen muchos sistemas distribuidos de control de versiones,
Git se encuentra entre los más populares. A lo largo del módulo, desarrollará las habilidades conceptuales y prácticas
esenciales para trabajar con Git y GitHub. Comenzará con una visión general de Git y GitHub, seguida de la creación de
una cuenta de GitHub y un repositorio de proyecto, añadiendo archivos al mismo y confirmando sus cambios mediante
la interfaz web. A continuación, se familiarizará con los flujos de trabajo de Git que implican ramas y pull requests (PRs)
y fusiones. También completará un proyecto al final para aplicar y demostrar sus habilidades recién adquiridas.
Objetivos de aprendizaje
▪ Describa las capacidades de R y el entorno RStudio.
▪ Utilice la función de trazado incorporada en R.
▪ Explique el control de versiones y describa el entorno Git y GitHub.
▪ Describa el propósito de los repositorios de fuentes y explique cómo GitHub satisface las necesidades de un
repositorio de fuentes.
▪ Explique cómo darse de alta en una cuenta de GitHub y describa cómo crear un repositorio.
▪ Demuestre cómo editar y subir archivos en GitHub.
▪ Explique el propósito de las ramas y describa cómo fusionar cambios en ramas.
1. IDE RStudio
1.1. Introducción a R y RStudio
(Video 3 Minutos)
WHAT YOU WILL LEARN
Bienvenido a «Introducción a R y RStudio». Después de ver este vídeo, podrá:
− Explicar qué es R.
− Enumerar las capacidades de R.
− Describir el entorno de RStudio.
− Enumerar las bibliotecas de R para la ciencia de datos.

WHAT IS R?
− R es un lenguaje de programación estadística.
− Es una herramienta poderosa para el procesamiento y la manipulación de datos, la inferencia
estadística, el análisis de datos y el algoritmo de aprendizaje automático.
− Según un análisis de 2017, se descubrió que R es el más utilizado por los académicos, el sector de la
salud y el gobierno.
− R admite la importación de datos de diferentes fuentes, como archivos planos, bases de datos, sitios
web y software estadístico como SPSS y STATA.
R CAPABILITIES
− R es el lenguaje preferido de algunos científicos de datos porque las funciones R son fáciles de usar.
− También es conocido por producir excelentes visualizaciones y contiene paquetes para gestionar el
análisis de datos sin necesidad de instalar bibliotecas adicionales.
WHAT IS RSTUDIO
− RStudio es un entorno de desarrollo integrado popular para desarrollar y ejecutar el código fuente y
los programas del lenguaje R.
− Mejora y aumenta la productividad con el lenguaje R.

RSTUDIO
R studio incluye: un editor de resaltado de sintaxis que permite la ejecución directa de código y un lugar
donde puede guardar un registro de su trabajo, una consola para escribir comandos R, un espacio de trabajo y
una pestaña de historial que muestran la lista de objetos R que creó durante la sesión de R y el historial de
todos los comandos anteriores y, por último, las pestañas Archivos, Gráficos, Paquetes y Ayuda.

TABS IN RSTUDIO
La pestaña Archivos muestra los archivos de tu directorio de trabajo.
La pestaña Gráficos muestra el historial de los gráficos que ha creado. También puede exportar los gráficos a
archivos PDF o de imagen.

La pestaña Paquetes muestra los paquetes R externos disponibles en su ordenador local.

Además, la pestaña Ayuda proporciona ayuda sobre los recursos de R, el soporte de R Studio , los paquetes y
mucho más.

POPULAR R LIBRARIES FOR DATA SCIENCE


Si R es tu herramienta preferida para la ciencia de datos, aquí tienes algunas bibliotecas populares de R
disponibles en la comunidad de ciencia de datos:
− dplyr para manipular datos
− stringr para manipular cadenas
− ggplot para visualizar datos
− caret para el aprendizaje automático.

Para que pueda empezar a aprender rápidamente, le proporcionamos un entorno virtual R Studio como parte
de los laboratorios de Skills Network Labs. Este entorno de laboratorio virtual está diseñado para ayudarlo a
practicar fácilmente lo que ha aprendido en el curso y evitar la necesidad de crear una cuenta o descargar o
instalar cualquier cosa.
RECAP
En este vídeo, aprendió las capacidades de R y sus usos en la ciencia de datos, la interfaz RStudio para
ejecutar códigos R y los populares paquetes R para la ciencia de datos.

1.2. Lectura opcional: Descargar e instalar R y RStudio


[…]
Laboratorio práctico: descargue e instale R y RStudio
Tiempo estimado necesario: 15 minutos

Múltiples programadores están avanzando hacia la ciencia de datos y, en este proceso, R y RStudio juegan un
papel esencial. Entonces, en esta práctica de laboratorio, comprenderá cómo instalar R y RStudio.

Objetivos
− Descargar e instalar R
− Descargar e instalar RStudio

Descripción general de R y RStudio


Existen varias herramientas de ciencia de datos basadas en la nube que hacen que la colaboración en equipo
sea accesible. A veces resulta útil trabajar directamente en el escritorio.

R es una interfaz de línea de comandos; Hay varias interfaces gráficas disponibles. RStudio es un IDE (entorno
de desarrollo integrado) para R. Incluye la pestaña ambiental, que muestra las variables generadas. En la
pestaña de historial, puede ver los comandos utilizados desde el inicio y hay otras pestañas como archivos,
gráficos, paquetes, ayuda y visor. Tiene binarios disponibles para las principales plataformas, incluidas
Windows, Linux y MacOS. Esta práctica de laboratorio incluye instrucciones para descargar e instalar R y
RStudio en Windows. Los usuarios de Mac OS pueden descargar el archivo .pkg apropiado desde
https://cran.r-project.org/bin/macosx/ y seguir las instrucciones.

Ejercicio 1: descargar e instalar R en Windows


Paso 1: La última versión de R se puede descargar haciendo clic en el enlace.

Ventanas: https://cran.r-project.org/bin/windows/base/

Pantalla de Configuración de Download R-4.2.0 for Windows

Paso 2: una vez que se complete la descarga, haga clic derecho en el archivo descargado y haga clic en

Ejecutar como administrador.


Haga clic derecho en el archivo de instalación y haga clic en Ejecutar como administrador

Paso 3: seleccione su idioma de instalación preferido y haga clic en Aceptar.

Seleccionar_idioma de configuración

Paso 4: Lea y acepte la licencia y haga clic en Siguiente.


Acuerdo de licencia con el siguiente enlace para continuar con la instalación

Paso 5: seleccione la carpeta donde desea instalar R, o use la ubicación predeterminada, y haga clic en
Siguiente.

Ubicación de la instalación

Paso 6: seleccione los componentes que desea instalar y haga clic en Siguiente.
Seleccione los componentes a instalar

Paso 7: En las opciones de Inicio, seleccione la opción Predeterminada y haga clic en Siguiente.

Startup_Options, seleccione Predeterminado

Paso 8: En la ventana Seleccionar tareas adicionales, mantenga Predeterminado y haga clic en Siguiente.
Seleccione Tareas adicionales, mantenga las predeterminadas

Paso 9: Una vez que la instalación sea exitosa, haga clic en Finalizar para cerrar la instalación.

Ejercicio 2: descargar e instalar RStudio


Paso 1: utilice el enlace siguiente para descargar RStudio Desktop en su máquina local.
Enlace para descargar RStudio para Windows y Mac: https://posit.co/download/rstudio-desktop/

Paso 2: Haga clic en Descargar RStudio Desktop para Windows y se iniciará la descarga.

Descargar_RStudio para Windows

Paso 3: Una vez que se complete la descarga, haga clic derecho en el archivo de instalación y haga clic en
Ejecutar como administrador.
Haga clic derecho en el archivo de instalación y haga clic en Ejecutar como administrador

Paso 4: en la ventana de configuración de RStudio, haga clic en Siguiente.

Bienvenido a la ventana de configuración de RStudio

Paso 5: Seleccione la carpeta donde desea instalar RStudio o conserve la ubicación de instalación
predeterminada y haga clic en Siguiente.
Elija la ubicación de instalación

Paso 6: en la ventana del menú Inicio, haga clic en Instalar para instalar RStudio.

Elija la carpeta del menú Inicio

Paso 7: Una vez que se complete la instalación, haga clic en Finalizar para cerrar la ventana.

Ejercicio 3: ejecutar código R en RStudio


1. Abra RStudio desde el menú de inicio de Windows.
Menú de inicio de Windows, open_RStudio
2. Haga clic en el símbolo más en la parte superior izquierda y seleccione R Script.

Ventana de RStudio, haga clic en el símbolo más y seleccione R Script


3. Se abre un panel R Script sin título. Quedaría de la siguiente manera.
Panel de programa y panel de consola de R Script sin título
4. Ahora, cargue el conjunto de datos del iris. Ingrese las siguientes líneas en la ventana del Editor que
aparece. A continuación, selecciónelos todos. Luego haga clic en el ícono Ejecutar justo encima de la
ventana del Editor.
1 biblioteca (conjuntos de datos)
2 datos (iris)
3 Ver (iris)
5. Se le llevará directamente a la pestaña de vista de datos para inspeccionar su conjunto de datos. Puede ver
cinco columnas en este conjunto de datos, las primeras cuatro son de punto flotante y la última es la etiqueta
de la cadena de tipo de datos, que contiene el valor de categoría de su conjunto de datos. Puedes ver que hay
un total de 150 entradas.

Ventana de R Studio, pestaña Vista de datos muestra su conjunto de datos con cinco columnas y 150
entradas
6. Ahora encontremos cuántas especies diferentes están presentes en el conjunto de datos. Escriba el
siguiente comando en la ventana del Editor y haga clic en Ejecutar.
1 único(iris$Especie)
Nota: En la ventana de la Consola en la parte inferior, verá el resultado del comando ejecutado y sabrá que
solo hay tres especies diferentes presentes en el conjunto de datos.

7. Guarde y proporcione un nombre a su Notebook.


− Para guardar el cuaderno, haga clic en Guardar o Guardar como en el menú Archivo.
Menú Archivo de R Studio, haga clic en Guardar o Guardar como
− Seleccione la carpeta de trabajo para cambiar el nombre de su cuaderno a My_Notebook.

Seleccione la carpeta de trabajo y cambie el nombre Cambiar nombre del cuaderno a Mi_Cuaderno
¡Felicidades! En este documento, ha aprendido cómo descargar e instalar R y RStudio en su máquina local.
También creó un cuaderno R y lo guardó.

1.3. Conceptos básicos de R con RStudio


[…]
Conceptos básicos de R usando RStudio
Logotipo de la red de habilidades

Laboratorio práctico: Conceptos básicos de R usando RStudio


Tiempo estimado necesario: 15 minutos

Objetivos de aprendizaje
Familiarízate con RStudio
Escriba su primer fragmento de código R en RStudio

Interfaz de usuario principal de RStudio


En esta práctica de laboratorio, conocerá RStudio, el IDE más popular y potente para desarrollar proyectos de
R.

La interfaz de usuario principal de RStudio se muestra aquí:


Interfaz de usuario de RStudio

▪ En el panel Consola, puede probar rápidamente algunos comandos de R y ver los resultados
inmediatamente.

▪ En el panel Editor de archivos, puede escribir su código R u otros archivos de texto con la ayuda del
resaltado de sintaxis y la finalización automática.

▪ En el panel Espacio de trabajo, puede revisar y administrar los objetos creados.

▪ En el panel Archivo/Trazados/Explorador de paquetes, puede administrar sus archivos y otros activos,


como trazados o paquetes.
Escribe el primer fragmento de código de Hello World en la consola.
Escribamos su primer Hola Mundo en RStudio Console.

▪ Busque el cursor parpadeante en el panel de la Consola, escriba una prin o print incompleta y haga
una pausa un momento para que RStudio muestre una lista de sugerencias emergente:

Lista de sugerencias emergentes del panel de la consola

La función de autocompletar de RStudio puede ayudar a evitar la necesidad de memorizar los detalles del
código y reducir las pulsaciones de teclas con solo seleccionar de una lista de sugerencias.

− Seleccione la función de print y agregue un carácter de entrada ¡Hola mundo!, luego presione la tecla
Enter:
1 print("¡Hola mundo!")

Deberías ver ¡Hola mundo! impreso en la consola.

¡Hola Mundo! fragmento de código


Eso es todo, ha escrito su primer fragmento de código Hello World en RStudio.

Para practicar, puedes jugar con la consola escribiendo cualquier cosa que hayas aprendido hasta ahora,
como crear variables y realizar operaciones matemáticas básicas.

Si desea borrar la consola, puede presionar Ctrl o Control + L combinación de teclas.


Revisar objetos R en el panel Entorno
Ahora probemos el panel Entorno para revisar los objetos R que creamos en la consola.

− Escriba y ejecute las siguientes tres líneas de código en la consola:


− 1 x<-1
− ¡Copiado!
− 1 y<-2
− ¡Copiado!
− 1 z<-x+y
− ¡Copiado!
Debería ver tres variables x, y, z con valores asignados en el panel Entorno.

Variables x, y y z con valores asignados

− Para limpiar el espacio de trabajo, puede hacer clic en el icono de la escoba como se muestra a
continuación:

El espacio de trabajo muestra el icono de la escoba

Crea tu primer archivo de script R


Hasta ahora, ha escrito un código R simple en la consola de forma interactiva. A continuación, cree un archivo
de script R con varias líneas de código y ejecútelos en modo por lotes.

− Primero, en el menú, haga clic en Archivo > Nuevo archivo > R Script.
Menú Archivo con Nuevo Archivo y R Script

− Luego haga clic en Archivo > Guardar y asigne un nombre al archivo como first_script. Una vez
guardado el archivo de script, podrá ver un archivo vacío llamado first_script.R creado en su directorio
de trabajo.

Archivo guardado en el directorio de trabajo

− A continuación, haga clic en el archivo first_script.R para agregar el siguiente fragmento de código:
1 x<- 3
2 y <- 4
3 z <- x + y
4 imprimir(z)

Debe asegurarse de que la última línea del archivo sea una nueva línea vacía.

Entonces, después de copiar el fragmento de código anterior, presione la tecla Enter para comenzar una
nueva línea en el archivo de secuencia de comandos.
Ahora puede ejecutar el código en el archivo de script; hay dos modos de ejecución:

− El primer modo se llama Ejecutar la línea o selección actual. Puede hacer clic y arrastrar el mouse o
usar las teclas Shift + Arriba/Abajo para seleccionar todas las líneas y luego hacer clic en el siguiente
ícono Ejecutar para ejecutarlas:

Ejecute el archivo de secuencia de comandos

El segundo modo se llama Fuente donde ejecuta todas las líneas de código en el archivo haciendo clic
en el siguiente icono de Fuente:

Haga clic en el ícono Fuente

Deberías ver los resultados en la consola:

source('/resources/rstudio/first_script.R')
[1] 7

Resultados en consola

¡De eso se trata de crear y ejecutar el archivo de script R!

Ejercicio: tareas de práctica


Tarea 1: crear un nuevo script R
− Asigne dos variables donde x = 10 e y = 20.
− Guarde el archivo como Subtract.R.
x <- 10
y <- 20

Tarea 2: Restar x de y. Almacenar en resultado variable e imprimir el resultado.


x <- 10
y <- 20
result <- y - x
print(result)

1.4. Trazado en RStudio


(Video 3 Minutos)
Bienvenido a «Plotting in RStudio».
WHAT YOU WILL LEARN
Después de ver este vídeo, podrá:
− Enumerar los paquetes de visualización de datos de R
− Utilizar la función de trazado R incorporada
− Utilizar la biblioteca R ggplot para añadir funciones y argumentos al gráfico
− Añadir títulos y nombres al gráfico.
USING DATA VISUALIZATION IN R
Con la afluencia de datos, uno de sus muchos trabajos como científico de datos es producir información
mediante visualizaciones. R tiene diferentes paquetes de visualización de datos que puede utilizar en función
de sus necesidades.
Para instalar estos paquetes en su entorno R, utilice los comandos install.packages y package name.
− Algunos ejemplos de paquetes R son los siguientes. ggplot se utiliza para visualizaciones de datos
como histogramas, gráficos de barras, diagramas de dispersión, etc. Permite añadir capas y
componentes a una sola visualización.
− Plotly se utiliza para visualizaciones de datos basadas en la web que se pueden mostrar o guardar
como archivos HTML individuales.
− Lattice se utiliza para implementar conjuntos de datos complejos y multivariables. Es una biblioteca
de visualización de datos de alto nivel que puede gestionar gráficos sin personalizaciones.
− Además, Leaflet se utiliza para crear gráficos interactivos.

USING THE PLOT FUNCTION


R tiene funciones incorporadas para crear gráficos y visualizaciones. Por ejemplo, puede crear un gráfico
utilizando la definición que se muestra aquí.
La función gráfica devuelve una gráfica de dispersión de los valores en comparación con el índice.
También puede añadir líneas a la función y un título para facilitar la lectura y la comprensión de la
visualización. Para añadir una línea, se especifica el tipo y, para añadir un título, se selecciona la función de
título. En el gráfico, ha añadido una línea y un título.

USING GGPLOT
Puede crear visualizaciones informativas utilizando la biblioteca ggplot de R. Puede gestionar solicitudes
complejas añadiendo capas a los gráficos utilizando diferentes funciones y argumentos. Por ejemplo, para
crear un diagrama de dispersión, usemos el conjunto de datos incorporado Mtcars.
− Primero leerás la biblioteca ggplot en la memoria mediante la función de biblioteca.
− A continuación, utilice la función ggplot en el marco de datos MTCars, especifique el eje X como
millas por galón y el eje Y como peso.
− A continuación, añada la función de puntos geográficos para especificar un gráfico de dispersión; de
lo contrario, devolverá un gráfico vacío.
El resultado será un gráfico más fácil de leer.

ADDING TITLES TO PLOT


Además, puede añadir títulos y cambiar el nombre del eje mediante el argumento Ggtitle y el argumento lab
para especificar los nombres apropiados para ambos ejes. El resultado será un gráfico con títulos
significativos.

USSING GGPLOT
En el laboratorio, recreará los gráficos con ggplot y la biblioteca de extensiones llamada gGally. Gally amplía
ggplot añadiendo varias funciones para reducir la complejidad de combinar objetos geométricos con datos
transformados.

RECAP
En este vídeo, aprendió sobre: los paquetes de visualización de datos más populares en R, cómo trazar con la
función de trazado R incorporada, cómo trazar con ggplot, cómo añadir títulos y cambiar los nombres de los
ejes con las funciones ggtitle y lab.

1.5. Introducción a RStudio e instalación de paquetes


[…]
Comenzando con RStudio e instalando paquetes
Objetivos del ejercicio:
Después de completar esta práctica de laboratorio, podrá:

− Cargar los conjuntos de datos


− Instalar bibliotecas
Paso 1: haga clic en el símbolo PLUS (más) en la parte superior izquierda y haga clic en R Script.

Captura de pantalla del menú desplegable

Se abre un panel R Script sin título. Se vería así.

Captura de pantalla del panel R Script

Paso 2: ahora carga el conjunto de datos del iris. Ingrese las siguientes líneas en la ventana del editor que
aparece. Luego seleccione todo el texto y haga clic en RUN(Ejecutar) justo encima de la ventana del editor.
library (datasets)
data(iris)
View(iris)
Captura de pantalla del panel R Script con las líneas anteriores ingresadas.

Paso 3: accederá a la pestaña de vista de datos para inspeccionar su conjunto de datos. El conjunto de datos
contiene cinco columnas y las primeras cuatro son de tipo punto flotante, mientras que la última columna es
una etiqueta de tipo de datos cadena que contiene el valor de la categoría. Puedes ver que hay un total de 150
entradas de las cuales puedes ver las primeras 7.

Captura de pantalla de la pestaña de vista de datos que muestra el conjunto de datos

Paso 4: ahora puedes encontrar las diferentes especies presentes en el conjunto de datos. Ingrese el
siguiente comando en la ventana del editor y haga clic en Ejecutar.
unique(iris$Species)
Captura de pantalla de la ventana del editor de datos que muestra el comando único (iris$Especies)

En la ventana de la Consola en la parte inferior, puede ver el resultado del comando ejecutado y saber que
solo hay tres especies diferentes presentes en el conjunto de datos.

Paso 5: a continuación, examinará el conjunto de datos con más detalle. Abra una consola.

Captura de pantalla resaltando la consola


Paso 6: ejecute el siguiente comando en la consola.
install.packages("GGally", repos = "https://cran.r-project.org", type = "source")
Captura de pantalla de la consola ejecutando install.packages('Ggally', repos = 'https://cran.r-project.org', type
= 'source')
Paso 7: haga clic en Entrar para instalar los paquetes.

Esto concluye el laboratorio; ¡Espero que lo hayan disfrutado!


1.6. Creación de visualizaciones de datos con ggplot
[…]
Creando visualizaciones de datos usando ggplot
Objetivo del ejercicio

Crearemos diferentes visualizaciones de datos usando el paquete ggplot usando el conjunto de datos
incorporado en R llamado mtcars.

1.Haga clic en el símbolo + en la parte superior izquierda y elija R Script en el menú para abrir una nueva
ventana de edición de R en RStudio:

2.Lea y vea las primeras 5 filas de datos usando lo siguiente:


library(datasets)

#Load Data

data(mtcars)

#View first 5 rows

head(mtcars, 5)
3.Escriba esto ?mtcars para obtener información sobre las variables. Esto imprimirá la información en el
panel inferior derecho, en la pestaña Ayuda.

4.Copie y pegue el siguiente código para cargar el paquete ggplot y crear un diagrama de dispersión de disp y
mpg.
#load ggplot package
library(ggplot2)

#create a scatterplot of displacement (disp) and miles per gallon (mpg)

ggplot(aes(x=disp,y=mpg,),data=mtcars)+geom_point()
5.Utilice el siguiente código para agregar un título.
#Add a title

ggplot(aes(x=disp,y=mpg,),data=mtcars)+geom_point()+ggtitle("displacement vs miles per gallon")

6.Utilice el siguiente código para cambiar el nombre del eje x y del eje y
#change axis name

ggplot(aes(x=disp,y=mpg,),data=mtcars)+geom_point()+ggtitle("displacement vs miles per gallon") +


labs(x = "Displacement", y = "Miles per Gallon")
7.Utilice lo siguiente para crear un diagrama de caja de la distribución de mpg para los tipos de motor
individuales frente al motor (0 = en forma de V, 1 = recto)
Para hacer esto tienes que hacer vs una cadena o factor.
#make vs a factor
mtcars$vs <- as.factor(mtcars$vs)

#create boxplot of the distribution for v-shaped and straight Engine

ggplot(aes(x=vs, y=mpg), data = mtcars) + geom_boxplot()


8.Agregue color a los diagramas de caja para ayudar a diferenciar:
ggplot(aes(x=vs, y=mpg, fill = vs), data = mtcars) +
geom_boxplot(alpha=0.3) +
theme(legend.position="none")
9.Finalmente, creemos el histograma de peso wt.
ggplot(aes(x=wt),data=mtcars) + geom_histogram(binwidth=0.5)
Con esto concluye este laboratorio, ¡esperamos que te hayas divertido!
1.7. Trazado con RStudio
[…]
Trazar con RStudio
Objetivo del ejercicio:

Esta práctica de laboratorio le presenta cómo trazar en R con ggplot y GGally. GGally es una extensión de
ggplot2.

Ejercicio:

1.Haga clic en el símbolo más en la parte superior izquierda y haga clic en R Script para crear un nuevo script
R, si aún no tiene uno abierto.
Creando un nuevo script R

2.Utilizará el conjunto de datos del iris. Si no lo tiene cargado, copie y pegue lo siguiente en su archivo de
script R.
library(datasets)
data(iris)
3.En la práctica de laboratorio anterior, instaló las bibliotecas necesarias para crear gráficos. Ejecutemos los
siguientes comandos:
library(GGally)
ggpairs(iris, mapping=ggplot2::aes(colour = Species))
4.Seleccione los comandos y haga clic en Ejecutar en la parte superior. Verá el siguiente gráfico en la ventana
Gráficos:

La ventana de gráficos muestra un nuevo gráfico.

5.Haga clic en el icono Zoom en la ventana del gráfico para ampliar y ver el gráfico.
Zoom para ver la trama

6.Esto le brinda mucha información para una sola línea de código. Primero, puede ver las distribuciones de
datos por columna y especie en diagonal. Luego verá todos los diagramas de dispersión por pares en los
mosaicos que quedan en la diagonal, nuevamente segregados por color. Es, por ejemplo, obvio que se puede
trazar una línea para separar setosa de versicolor y virginica. En cursos posteriores, también aprenderá cómo
se pueden separar las especies superpuestas. Esto se denomina aprendizaje automático supervisado que
utiliza clasificadores no lineales. También puede ver la correlación entre columnas individuales en los
mosaicos a la derecha de la diagonal, lo que confirma que setose es más diferente y, por lo tanto, más fácil de
distinguir, que versicolor y virginica. Un valor de correlación cercano a uno significa alta similitud, mientras
que un valor más cercano a cero significa menos similitud. Los gráficos restantes a la derecha se llaman
diagramas de caja y los de la parte inferior se llaman histogramas, pero aprenderá sobre esto en un curso más
avanzado de esta serie.

2. GitHub
2.1. Visión general de Git/GitHub
(Video 4 Minutos)

(Música) En este vídeo, obtendrás una visión general de Git y GitHub, que son entornos populares entre los
desarrolladores y los científicos de datos para controlar las versiones de los archivos y proyectos de código
fuente y colaborar con otros.
VERSION CONTROL
No se puede hablar de Git y GitHub sin tener una comprensión básica de lo que es el control de versiones. Un
sistema de control de versiones te permite realizar un seguimiento de los cambios en tus documentos. Esto te
facilita la recuperación de versiones antiguas de tu documento en caso de que cometas un error y facilita
mucho la colaboración con otros usuarios.

WORKING WITHOUT VERSION CONTROL


A continuación se muestra un ejemplo para ilustrar cómo funciona el control de versiones. Supongamos que
tienes una lista de compras y quieres que tus compañeros de habitación confirmen las cosas que necesitas y
añadan artículos adicionales. Sin el control de versiones, tienes un gran lío que arreglar antes de poder ir de
compras.

WORKING WITH VERSION CONTROL


Con el control de versiones, sabes exactamente lo que necesitas después de que todos hayan aportado sus
ideas.
GIT
− Git es un software gratuito y de código abierto distribuido bajo la Licencia Pública General GNU.
− Git es un sistema de control de versiones distribuido, lo que significa que los usuarios de cualquier
parte del mundo pueden tener una copia de su proyecto en su propia computadora.
− Cuando hayan realizado cambios, podrán sincronizar su versión con un servidor remoto para
compartirla contigo.
− Git no es el único sistema de control de versiones que existe, pero el aspecto distribuido es una de las
principales razones por las que se ha convertido en uno de los sistemas de control de versiones más
comunes disponibles.
− Los sistemas de control de versiones se utilizan ampliamente para cosas relacionadas con el código,
pero también puedes controlar las versiones de imágenes, documentos y cualquier tipo de archivos.

Puedes usar Git sin una interfaz web mediante la interfaz de línea de comandos, pero GitHub es uno de los
servicios hospedados en la web más populares para los repositorios de Git. Otros incluyen GitLab, BitBucket y
Beanstalk.

SHORT GLOSSARY OF TERMS


Hay algunos términos básicos que necesitarás conocer antes de empezar.
− El protocolo SSH es un método para el inicio de sesión remoto seguro de un ordenador a otro.
− Un repositorio contiene las carpetas del proyecto que están configuradas para el control de
versiones.
− Una bifurcación es una copia de un repositorio.
− Una solicitud de cambios es la forma en la que solicitas que alguien revise y apruebe tus cambios
antes de que sean definitivos.
− Un directorio de trabajo contiene los archivos y subdirectorios de tu ordenador que están asociados a
un repositorio de Git.

BASIC GIT COMMANDS


Hay algunos comandos básicos de Git que siempre utilizarás. Cuando empieces con un repositorio nuevo,
solo tendrás que crearlo una vez: de forma local y, a continuación, subirlo a GitHub, o bien clonar un
repositorio existente con el comando «git init».
«git add» mueve los cambios del directorio de trabajo al área de ensayo.
«git status» te permite ver el estado de tu directorio de trabajo y una instantánea provisional de los cambios.
«git commit» toma tu instantánea provisional de los cambios y los confirma en el proyecto.
«git reset» deshace los cambios que has realizado en los archivos de tu directorio de trabajo.
«git log» te permite buscar cambios anteriores en un proyecto.
«git branch» te permite crear un entorno aislado dentro de tu repositorio para realizar cambios.
«git checkout» te permite ver y cambiar las ramas existentes.
«git merge» te permite volver a armar todo.

Para aprender a utilizar Git de forma eficaz y empezar a colaborar con científicos de datos de todo el mundo,
tendrás que aprender los comandos esenciales. Por suerte para nosotros, GitHub tiene recursos increíbles
disponibles para ayudarte a empezar. Ve a try.github.io para descargar las hojas de trucos y consultar los
tutoriales. En los siguientes módulos, te ofreceremos un curso intensivo sobre cómo configurar tu entorno
local y cómo empezar un proyecto.
2.2. Introducción a GitHub
(Video 4 Minutos)

(Música) Bienvenido a Introducción a GitHub Después de ver este vídeo, podrás: Describir el propósito de los
repositorios de código fuente y explicar cómo GitHub satisface las necesidades de un repositorio de código
fuente.
BACKGROUND OF GIT
El desarrollo de Linux a principios de la década de 2000 se gestionaba mediante un sistema de uso gratuito
conocido como BitKeeper.
− En 2005, BitKeeper pasó a ser un sistema de pago, lo que supuso un problema para los
desarrolladores de Linux por muchas razones.
− Linus Torvalds dirigió un equipo para desarrollar un sistema de control de versiones fuente que lo
sustituyera.
− El proyecto se llevó a cabo en un breve período de tiempo y un pequeño grupo definió las
características clave. Estas incluyen:
o Un fuerte apoyo al desarrollo no lineal. (Los parches de Linux llegaban entonces a un ritmo de
6,7 parches por segundo)
o Desarrollo distribuido. Cada desarrollador puede tener una copia local del historial de
desarrollo completo.
o Compatibilidad con los sistemas y protocolos existentes. Esto era necesario para reconocer
la diversidad de la comunidad Linux.
o Manejo eficiente de grandes proyectos.
o Autenticación criptográfica del historial. Esto garantiza que todos los sistemas distribuidos
tengan actualizaciones de código idénticas.
o Estrategias de fusión conectables. Muchas vías de desarrollo pueden llevar a decisiones de
integración complejas que pueden requerir estrategias de integración explícitas.
GIT REPOSITORY MODEL
¿Qué tiene de especial el modelo de repositorio de Git?
• Git está diseñado como un sistema de control de versiones distribuido.
• Se centra principalmente en el seguimiento del código fuente durante el desarrollo.
• Contiene elementos para coordinar entre los programadores, realizar un seguimiento de los cambios
y respaldar los flujos de trabajo no lineales.
• Creado en 2005 por Linus Torvalds para la distribución de núcleos de Linux.

+
WHAT IS GIT?
• Git es un sistema de control de versiones distribuido que se utiliza para rastrear los cambios en el
contenido.
• Sirve como punto central de colaboración con un enfoque particular en las metodologías de
desarrollo ágiles.
• En un sistema central de control de versiones, todos los desarrolladores deben extraer el código del
sistema central y volver a utilizarlo.
• Como Git es un control de versiones distribuido, cada desarrollador dispone de una copia local del
historial de desarrollo completo y los cambios se copian de un repositorio a otro.
• Cada desarrollador puede actuar como centro.
• Cuando Git se usa correctamente, hay una rama principal que corresponde al código desplegable.
• Los equipos pueden integrar de forma continua los cambios que están listos para su publicación y
trabajar simultáneamente en ramas separadas entre versiones.
• Git también permite la administración centralizada de las tareas con controles de nivel de acceso
para cada equipo.
• Git puede coexistir localmente, por ejemplo, a través del cliente GitHub Desktop, o puede usarse
directamente a través de un navegador conectado a la interfaz web de GitHub.
• IBM Cloud se basa en herramientas de código abierto sólidas y consolidadas, incluidos los
repositorios de Git, a menudo denominados repositorios.
WHAT IS GITHUB?
• GitHub es un servicio de alojamiento online para repositorios de Git.
• GitHub está hospedado por una subsidiaria de Microsoft. GitHub ofrece cuentas gratuitas,
profesionales y empresariales.
• En agosto de 2019, GitHub tenía más de 100 millones de repositorios.
WHAT IS A REPOSITORY?
• Un repositorio es: una estructura de datos para almacenar documentos, incluido el código fuente de
la aplicación.
• Un repositorio puede rastrear y mantener el control de versiones.

• GitLab es una plataforma DevOps completa, que se entrega como una sola aplicación.
• GitLab proporciona acceso a los repositorios de Git, controlados mediante la gestión del código
fuente.
• Con GitLab, los desarrolladores pueden: Colaborar, revisar el código, hacer comentarios y ayudarse a
mejorar el código de los demás.
• Trabajen desde su propia copia local del código. Ramifica y fusiona el código cuando sea necesario.
• Optimice las pruebas y la entrega con la integración continua (CI) y la entrega continua (CD)
integradas.

SUMMARY
• En este vídeo, aprendiste lo siguiente: GitHub es el servicio de alojamiento en línea para los
repositorios de Git.
• Los repositorios almacenan documentos, incluido el código fuente de las aplicaciones, y permiten a
los colaboradores realizar un seguimiento y mantener el control de las versiones.
• ¿Qué tiene de especial el modelo de repositorio de Git? Git está diseñado como un sistema de control
de versiones distribuido.
• Se centra principalmente en el seguimiento del código fuente durante el desarrollo.
• Contiene elementos para coordinar entre los programadores, realizar un seguimiento de los cambios
y respaldar los flujos de trabajo no lineales.

2.3. Repositorios de GitHub


(Video 4 Minutos)

(Música) ¡Bienvenido a los repositorios de GitHub!


OBJETIVES
Después de ver este vídeo, podrás: Explicar cómo registrarte en una cuenta de GitHub y describir cómo crear
un repositorio.
CREATE AN ACOUNT
Registrarse para obtener una cuenta personal gratuita en GitHub es rápido y sencillo.
Comienza en el sitio de GitHub, https://github.com.
Deberás elegir un nombre de usuario, ingresar tu dirección de correo electrónico y seleccionar una
contraseña, luego hacer clic en Registrarse en GitHub.

VERIFY YOUR COUNT


A continuación, tendrás una breve prueba para demostrar que eres una persona. Haz clic en Verificar y
resuelve el rompecabezas presentado. Cuando termines, haz clic en unirte a un plan gratuito y, a
continuación, aparecerá una pantalla en la que podrás seleccionar el tipo de cuenta. Lo más probable es que
lo único que desees sea una cuenta personal gratuita. Elige configurar una cuenta personal gratuita, que es la
predeterminada.

GETTING STARTED
GitHub te hace algunas preguntas sobre tu trabajo, tu experiencia en programación y tus intereses. Puedes
omitirlas si lo deseas. Por último, tendrás que responder a un correo electrónico que recibas y que demuestre
que te has vinculado a GitHub desde una cuenta a la que accedes. Te proporciona algunos puntos de partida.
Puedes elegir crear un repositorio o una organización, o puedes realizar el curso de Introducción a GitHub.
Recuerda que un repositorio es una estructura de datos para almacenar documentos, incluido el código
fuente de una aplicación, que rastrea y mantiene el control de las versiones. Una organización es un conjunto
de cuentas de usuario que posee repositorios. Las organizaciones tienen uno o más propietarios, que tienen
privilegios administrativos para la organización. O bien, puede omitir esto por ahora y ponerse manos a la obra
inmediatamente.
GitHub proporciona muchos recursos para ayudarte a trabajar de forma eficaz. Cuando tengas tiempo, lee la
guía de GitHub.

CREATE A REPOSITORY
El núcleo de un proyecto basado en Git es el repositorio. Contiene todo el código y los elementos
relacionados, incluidos elementos como: un archivo README para describir el propósito del proyecto. Una
licencia para expresar las formas en que las personas pueden usar tu código, etc. También puedes hacer que
tu repositorio sea privado (solo disponible para personas con cuentas que tengan permiso para verlo) o
público (todo el mundo pueda buscarlo y verlo).

EXPLORING YOUR REPOSITORY


Cuando crees tu repositorio, verás que tiene varias pestañas y que 37 00:02:34,310 --> 00:02:37,069 está
abierto en la pestaña Código. Código: aquí es donde residen todos los archivos fuente. Git se creó
inicialmente como un repositorio de código fuente y ahora todo tipo de archivos acaban aquí. Si has creado
un README y/o una licencia, eso es todo lo que tienes aquí ahora mismo. Problemas: como puedes imaginar,
puedes hacer un seguimiento y planificar con herramientas como «Problemas», que enumera todos los
elementos pendientes en función de tu base de proyectos. Solicitudes de cambios: esto forma parte del
mecanismo de colaboración con otros usuarios. Las solicitudes de extracción definen los cambios que están
confirmados y listos para ser revisados antes de incorporarlos a la rama principal. Proyectos: todas las
herramientas para gestionar, clasificar, planificar, etc., sus diversos proyectos. Este es el núcleo del poder
colaborativo de GitHub. Wiki, Security e Insights: estas herramientas, que suelen reservarse a usuarios más
avanzados, proporcionan una base de comunicación con la comunidad de usuarios externos. Configuración:
GitHub permite una gran cantidad de personalizaciones, como cambiar el nombre del repositorio y controlar
el acceso.

SUMMARY
En este vídeo, aprendiste: Cómo crear y verificar una cuenta de GitHub. Los repositorios son estructuras de
almacenamiento que pueden almacenar código, realizar un seguimiento de los problemas y permitirte
colaborar con otros.

2.4. GitHub - Primeros pasos


(Video 3 Minutos)

En el vídeo anterior, aprendiste sobre Git y GitHub. Antes de continuar con este vídeo, regístrate para obtener
una cuenta de GitHub e inicia sesión.
Creating a new REPOSITORY
Empecemos por crear un repositorio nuevo.

CREATING A NEW REPOSITORY


Haga clic en + y, a continuación, en Nuevo repositorio.

PROVIDING THE DETAILS


Para crear un repositorio nuevo, debe proporcionar los siguientes detalles: asigne un nombre al nuevo
repositorio; si lo desea, añada una descripción del repositorio; elija la visibilidad del repositorio (si quiere que
sea pública o privada) y elija la opción de inicializar este repositorio con el archivo readme. A continuación,
haz clic en Crear repositorio.
REPOSITORY CREATED
Ahora se le redirigirá al repositorio que ha creado. La carpeta raíz de tu repositorio aparece de forma
predeterminada y solo tiene un archivo README.md.

Editing a file in THE REPOSITORY


Ahora es el momento de editar el archivo readme. Puedes hacerlo en tu navegador. Simplemente haga clic en
el lápiz para abrir el editor en línea y podrá cambiar el texto del archivo readme.

CHANGE THE TEXT

COMMIT CHANGES
Para guardar los cambios en el repositorio, debe confirmarlos. Una vez realizados los cambios, desplázate
hacia abajo hasta la sección Confirmar cambios. Añade un mensaje de confirmación y, si lo deseas, añade
una descripción y, a continuación, haz clic en Confirmar cambios. La opción «confirmar cambios» se utiliza
para guardar los cambios en el repositorio.
CHANGES REFLECTED IN THE FILE
Vuelva a la pantalla de inicio haciendo clic en el enlace del nombre del repositorio. Tenga en cuenta que el
archivo readme está actualizado y compruebe los cambios.

CREATING A NEW FILE


Aprendamos cómo crear un archivo nuevo utilizando el editor web integrado proporcionado por GitHub, que
se ejecuta en el navegador. Haz clic en Añadir archivo y, a continuación, en Crear nuevo archivo para crear el
nuevo archivo.

WRITING A FILE CONTENT


Para crear un archivo de python llamado firstpython.py. Primero, proporciona el nombre del archivo. A
continuación, añada un comentario que describa el código y, a continuación, añada el código.
COMMIT CHANGES
Cuando termines, confirma el cambio en el repositorio.

CHANGES REFLECT TO MASTER


Puedes ver que tu archivo ya está agregado al repositorio y que la lista de repositorios muestra cuándo se
agregó o modificó el archivo. Cuando necesites cambiar el archivo, puedes volver a editarlo. Haz clic en el
nombre del archivo y, a continuación, en el icono del lápiz, realiza las modificaciones y confirma los cambios.

UPLOADING A FILE

También puedes cargar un archivo desde tu sistema local al repositorio. En la pantalla de inicio del
repositorio, haga clic en Añadir archivo y elija la opción Cargar archivos.
SELECT A FILE TO UPLOAD
Haga clic en Elija sus archivos y seleccione los archivos que desee cargar desde su sistema local. El proceso
de carga de archivos puede tardar poco, en función de lo que esté cargando. Cuando los archivos terminen de
cargarse, haz clic en Confirmar cambios.

COMMIT CHANGES
El repositorio ahora refleja los archivos que se cargaron.

SUMMARY
En este vídeo, aprendió a crear un repositorio, editar archivos y confirmar cambios mediante la interfaz web.

2.5. Laboratorio práctico: Primeros pasos con GitHub


[…]
Laboratorio práctico: introducción a GitHub
Esfuerzo: 20 min

En esta práctica de laboratorio, comenzará con GitHub creando una cuenta y un proyecto de GitHub y
agregando un archivo usando su interfaz web.

Objetivos
Después de completar esta práctica de laboratorio, podrá:

1. Describir GitHub
2. Crea una cuenta de GitHub
3. Agregar un proyecto y repositorio
4. Editar y crear un archivo
5. Sube un archivo y confirma

Descripción general de GitHub


Primero, permítanos presentarle GitHub. GitHub es una colección de carpetas y archivos. Es un servicio de
alojamiento de repositorios Git, pero agrega muchas características propias. Git es una herramienta de línea
de comandos. Aloja y mantiene un servidor a través de la línea de comandos. GitHub le proporciona este
servidor Git y una interfaz gráfica basada en web. También proporciona control de acceso y funciones de
colaboración, como wikis y herramientas básicas de gestión de tareas para cada proyecto. Además, GitHub
proporciona almacenamiento en la nube para el código fuente, admite todos los lenguajes de programación
populares y agiliza el proceso de iteración. GitHub incluye un plan gratuito para desarrolladores individuales y
alojamiento de proyectos de código abierto.

Ejercicio 1: creación de una cuenta de GitHub


Utilice los siguientes pasos para crear una cuenta en GitHub:

Paso 1: crea una cuenta: https://github.com/join

NOTA: Si ya tiene una cuenta de GitHub, puede omitir este paso y simplemente iniciar sesión en su cuenta.

Paso 2: Proporcione los detalles necesarios para crear una cuenta como se muestra a continuación:
Crea tu cuenta.

Haga clic en Crear cuenta.

Paso 3: Haga clic en Verificar para verificar la cuenta y haga clic en Listo.
Verifica tu cuenta.

Paso 4: Después de la verificación, haga clic en Unirse a un plan gratuito.

Únase a un plan gratuito.

Paso 5: seleccione los detalles como se muestra a continuación y haga clic en Completar configuración.

Configuración completa.

Paso 6: Vaya a su correo electrónico, busque el correo electrónico de verificación de GitHub y haga clic en el
botón o enlace Verificar su correo electrónico en ese correo electrónico para verificar.
NOTA: Si no recibe el correo electrónico de verificación, haga clic en Reenviar correo electrónico de
verificación.

Verifique su dirección de correo electrónico.

El correo electrónico está verificado.

Correo Electrónico Verificado.


Ejercicio 2: Agregar un proyecto y un repositorio
Paso 1: haga clic en el símbolo + y haga clic en Nuevo repositorio.

Nuevo repositorio.

Paso 2: proporcione un nombre para el repositorio e inicialícelo con el archivo README.md vacío.
Detalles del repositorio.

Haga clic en Crear repositorio.

Ahora serás redirigido al repositorio que has creado.

Comencemos a editar el repositorio.

Ejercicio 3: crear y editar un archivo


Ejercicio 3a: editar un archivo
Paso 1: Una vez creado el repositorio, la carpeta raíz de su repositorio aparece de forma predeterminada y
tiene un solo archivo, ReadMe.md. Haga clic en el icono de lápiz para editar el archivo.

Editar archivo.

Paso 2: agregue algo de texto al archivo.


Añade algo de texto.

Paso 3: Desplácese hacia abajo en la página después de agregar el texto y haga clic en Confirmar cambios.

Cometer cambios.

Ahora, verifique que su archivo esté editado con el nuevo texto.

Ejercicio 3b: crear un nuevo archivo


Paso 1: haga clic en el nombre del repositorio para regresar a la rama maestra, como en este testrepo.

Agregar archivo1.

Paso 2: haga clic en Agregar archivo y seleccione Crear nuevo archivo para crear un archivo en el repositorio.
Crear nuevo archivo.

Paso 3: proporcione el nombre del archivo y la extensión del archivo. Por ejemplo, firstpython.py y agregue las
líneas.

Agregar nombre de archivo.

Paso 4: desplácese hacia abajo en la página después de agregar el texto. Agregue una descripción del archivo
(opcional) y haga clic en Confirmar nuevo archivo.

Confirmar nuevo archivo.

Paso 5: Su archivo ahora se agrega a su repositorio y la lista del repositorio muestra cuándo se agregó y
modificó el archivo.

Ejercicio 4: cargar un archivo y confirmar


Paso 1: Haga clic en Agregar archivo y seleccione Cargar archivos para cargar un archivo (cualquier archivo
.txt, .ipynb, .png) en el repositorio desde la computadora local.
Subir archivos.

Paso 2: haga clic en elegir sus archivos y seleccione los archivos de su computadora.

Selecciona archivos.

Paso 3: Una vez que el archivo termine de cargarse, haga clic en Confirmar cambios.

Confirmar archivos cargados.

Paso 4: Ahora, su archivo está cargado en el repositorio.

Consultar cambio.

Resumen
En este documento, ha aprendido cómo crear un nuevo repositorio, agregar un nuevo archivo, editar un
archivo, cargar un archivo en un repositorio y confirmar los cambios.

2.6. GitHub - Trabajar con ramas


(Video 5 Minutos)
Bienvenido a «GitHub: trabajar con sucursales». Después de ver este vídeo, podrás definir una rama de
GitHub, crear ramas principales y secundarias , describir cómo fusionar ramas y crear una solicitud de
cambios.
Una rama es una instantánea de tu repositorio en la que puedes realizar cambios. Es una copia de la rama
principal y se puede utilizar para desarrollar y probar cambios en el flujo de trabajo antes de fusionarla con la
rama principal. En Git y GitHub, hay una rama principal llamada master. Tiene el código desplegable y es la
versión oficial de trabajo de tu proyecto. Su objetivo es que sea estable, por lo que es recomendable no
insertar ningún código que no haya sido probado en el maestro. Si desea cambiar el código y el flujo de trabajo
en la rama maestra, puede crear una copia de la rama maestra. Esta puede ser la rama secundaria que será
una copia del flujo de trabajo.

En la rama secundaria, se realizan cambios y experimentos. Puede crear, editar, probar los cambios y, cuando
esté satisfecho con ellos, puede volver a combinarlos en la rama maestra, donde puede preparar el modelo
para su despliegue. Como puede ver, todo esto se hace fuera de la rama principal y, hasta que no se fusione,
no se realizarán cambios en el flujo de trabajo antes de la ramificación.

Para garantizar que los cambios realizados por un miembro no impidan ni afecten al flujo de trabajo de otros
miembros, se pueden crear varias ramas y fusionarlas adecuadamente con la rama maestra una vez que el
flujo de trabajo se haya probado y aprobado correctamente.
Para crear sucursales en GitHub, echemos un vistazo a este repositorio. Actualmente hay una rama en el
repositorio. Si quieres hacer algunos cambios, pero no quieres modificar la maestra en caso de que algo vaya
mal, crearás una rama.

Para ello, harás clic en la flecha desplegable y crearás una nueva rama. Asigne el nombre «rama secundaria» a
la nueva rama y, a continuación, haga clic en Entrar.

El repositorio ahora tiene dos ramas, la rama principal y la secundaria. Para comprobarlo, selecciona la rama
secundaria en la lista desplegable del selector de ramas. Todo el contenido de la rama maestra se copia en la
rama secundaria. Sin embargo, puede añadir archivos en la rama secundaria sin añadir ninguno a la rama
maestra.
Para añadir un archivo, asegúrese de que la rama secundaria esté seleccionada en la lista desplegable del
selector de ramas. A continuación, haga clic en Crear nuevo archivo.

En el espacio correspondiente, asigne al archivo el nombre «test child punto py» y, a continuación, añada
algunas líneas de código. Puedes imprimir la declaración dentro de la rama secundaria.

En la parte inferior de la pantalla, verás una sección llamada «Confirmar un nuevo archivo». Los mensajes de
confirmación son importantes ya que ayudan a realizar un seguimiento de los cambios realizados. Agrega un
mensaje de confirmación descriptivo para mayor comodidad del equipo. Aquí puedes añadir «Create test
child dot py». Luego haz clic en Confirmar nuevo archivo.
El archivo se añade a la rama secundaria. Para comprobarlo, diríjase a la rama principal haciendo clic en
«maestra» en el menú de selección de sucursales y verá que el nuevo archivo no se ha añadido a la rama
principal.

Una vez creado el nuevo archivo, pruébelo y asegúrese de que funciona. Puedes combinar los cambios de la
rama secundaria para que se reflejen en la rama maestra creando una solicitud de cambios (PR). Las
solicitudes de extracción muestran las diferencias en el contenido de ambas ramas. Puede notificar a otros
miembros del equipo los cambios y las modificaciones en la rama principal. Lo ideal es que otro miembro del
equipo revise los cambios y apruebe su fusión con la rama principal. Las solicitudes de cambios son un medio
de colaboración en GitHub. Cuando abres una solicitud de cambios, propones tus cambios. Puedes asignar
miembros del equipo para que revisen y aprueben tu contribución y la fusionen en la sucursal de destino.

Para abrir una solicitud de extracción y ver las diferencias entre las sucursales, haz clic en Comparar y
solicitar información.

Si te desplazas hacia abajo hasta la parte inferior de la pantalla, verás la comparación entre ambas
sucursales. Muestra que un archivo ha cambiado y que el archivo tiene dos adiciones, las dos líneas que has
añadido al archivo sin eliminaciones.
Ahora crearás la solicitud de extracción. Agrega el título y un comentario opcional. Haz clic en Crear solicitud
de extracción. La siguiente pantalla mostrará los detalles de la solicitud de extracción.

Si estás de acuerdo con los cambios, haz clic en Combinar la solicitud de extracción y, a continuación, en
Confirmar.

Recibirás una confirmación de que la solicitud de extracción se ha fusionado correctamente. Puedes eliminar
la sucursal si ya no necesitas editar o añadir nueva información.
Ahora, la rama secundaria se ha fusionado por completo con la rama maestra. Puedes comprobar la rama
maestra y comprobar que contiene el archivo punto py secundario de prueba.

En este vídeo, aprendiste: una rama es una instantánea de tu repositorio en la que puedes realizar cambios.
En la rama secundaria, puedes crear, editar y probar los cambios y, a continuación, combinarlos con la rama
maestra. Para garantizar que los cambios realizados por un miembro no impidan ni afecten al flujo de trabajo
de los demás miembros, se pueden crear varias ramas y fusionarlas con la principal. Además, una solicitud
de cambios es una forma de notificar a los demás miembros del equipo los cambios y las modificaciones en
la rama principal.

2.7. Laboratorio práctico: Bifurcación y fusión (Web UI)


[…]
Laboratorio: ramificación y fusión (UI web)
Tiempo estimado: 15 minutos

Objetivos
Después de completar esta práctica de laboratorio, podrá:

1. Crear una sucursal


2. Confirmar cambios en una rama secundaria
3. Abrir una solicitud de extracción
4. Fusionar una solicitud de extracción en la rama principal

Requisitos previos
Esta práctica de laboratorio requiere que haya creado una cuenta de GitHub con un repositorio, como se
explica en la práctica de laboratorio Introducción a GitHub.

NOTA: En el pasado, la rama predeterminada en su repositorio de GitHub usaba el nombre master. A partir del
1 de octubre de 2020, todos los repositorios nuevos de GitHub utilizarán el término más inclusivo main como
nombre de la rama predeterminada en lugar de master.

1. Crea una sucursal


Puedes crear o eliminar ramas usando la página web de GitHub de tu repositorio. Para agregar una rama a su
repositorio, complete los siguientes pasos:

1.Vaya a la página principal de su repositorio. Tenga en cuenta que cuando creó su repositorio, se creó una
rama llamada main.

2.En la parte superior de la lista de archivos, busque el menú desplegable Rama. (De forma predeterminada,
el menú muestra Rama: principal). Haga clic en el menú desplegable, escriba el nombre de la rama que desea
crear y presione Entrar o regresar en su teclado.

Su repositorio ahora tiene dos ramas: Main y Child_Branch. Puede hacer clic en el menú desplegable para ver
sus sucursales.

Todos los archivos que estaban en la rama principal se reflejan en Child_Branch. Tenga en cuenta que cuando
agrega o edita un archivo en Child_Branch, ese cambio no se reflejará automáticamente en la rama principal.

2. Agregar un archivo a una rama


Para agregar un archivo a su nueva rama, asegúrese de que el nombre que le dio a la nueva rama (que en el
caso del ejemplo mostrado es Child_Branch) se muestre en el menú desplegable Rama y complete los
siguientes pasos:

1.Haga clic en Agregar archivo > Crear nuevo archivo para crear un archivo en el repositorio.

2.Escriba un nombre y una extensión para el archivo, por ejemplo, testchild.py, y agregue las siguientes líneas
al cuerpo del nuevo archivo:

3.Desplácese hasta la parte inferior de la página, agregue una descripción del archivo que está a punto de
agregar (tenga en cuenta que la descripción es opcional) y haga clic en Confirmar.

El archivo se agrega a su rama secundaria.

3. Abra una solicitud de extracción


El archivo que agregó a su rama secundaria no se agrega automáticamente a la rama principal. (Puede
verificar esto usando el menú desplegable Rama para ir a la rama principal; tenga en cuenta que no hay
ningún archivo testchild.py en la lista de archivos).
También puede comparar las dos ramas y abrir una solicitud de extracción, que le permitirá fusionar los
cambios que realizó en la rama secundaria (en este caso, agregar un nuevo archivo) a la rama principal.

1.En Child_Branch, haga clic en el botón Comparar y solicitar extracción.

2.Desplácese hasta el final de la página y observe que hay 1 archivo modificado en la lista y los cambios están
resaltados en verde.

3.Desplácese hacia arriba y observe que GitHub está comparando las ramas principal y Child_Branch y que
no hay conflictos entre las dos. Opcionalmente, puedes agregar un comentario a la solicitud de extracción.
Haga clic en Crear solicitud de extracción.

La solicitud de extracción se creó correctamente y ahora está lista para que un administrador del repositorio
la combine. Para todos los repositorios que cree, automáticamente tendrá derechos administrativos.

4. Fusionar una solicitud de extracción


Para fusionar una solicitud de extracción en un proyecto, complete los siguientes pasos:

1.Haga clic en la pestaña Solicitudes de extracción. Se muestra una lista de solicitudes de extracción
pendientes.

2.Haga clic en la solicitud de extracción que desea fusionar con el proyecto principal. Revise los cambios,
haga clic en Combinar solicitud de extracción para aceptar la solicitud de extracción y fusionar las
actualizaciones. (Opcionalmente puedes agregar un comentario).
3.Cuando hace clic en Fusionar solicitud de extracción, se muestra un botón Confirmar fusión. Haga clic en
ese botón para completar la combinación.

La solicitud de extracción ahora se ha fusionado correctamente. Tenga en cuenta que puede eliminar la rama
secundaria porque sus cambios se han incorporado a la rama principal.

Verifique la lista de archivos en la rama principal para confirmar que ahora incluye el archivo que agregó en la
solicitud de extracción.
Resumen
¡Felicidades! Ahora ha aprendido cómo crear una rama, editar y confirmar cambios en esa rama, abrir una
solicitud de extracción y fusionar la solicitud de extracción en su proyecto principal. Le recomendamos que
continúe experimentando con sucursales y solicitudes de extracción para familiarizarse más con los
conceptos y procesos.
2.8. [Opcional] Introducción a las ramas mediante comandos Git
[…]
Laboratorio práctico: introducción a las ramas mediante comandos de Git

Tiempo estimado necesario: 25 minutos

Objetivos
Después de completar esta práctica de laboratorio, podrá usar comandos de git para trabajar con ramas en un
repositorio local, que incluyen:

1. Crea un nuevo repositorio local usando git init


2. Cree y agregue un archivo al repositorio usando git add
3. Confirmar cambios usando git commit
4. Crea una rama usando git branch
5. Cambiar a una sucursal usando git checkout
6. Verifique el estado de los archivos modificados usando git status
7. Revisar confirmaciones recientes usando git log
8. Revertir cambios usando git revert
9. Obtenga una lista de sucursales y sucursales activas usando git branch
10. Fusione los cambios en su rama activa en otra rama usando git merge

Requisitos previos
Esta práctica de laboratorio está diseñada para ejecutarse en Skills Network, Cloud IDE que se ejecuta en un
sistema Linux en la nube y que ya tiene git instalado. Si tiene intención de ejecutar esta práctica de laboratorio
en su propio sistema, asegúrese de tener instalado git (en Linux o MacOS) o Git Bash (en Windows). Verifique
si está utilizando credenciales válidas y asegúrese de tener una conexión a Internet estable y un navegador
compatible. En caso de cualquier problema, considere borrar el caché/las cookies y volver a intentarlo.

Inicializar: abrir una nueva ventana de terminal


Abra una ventana de terminal en su IDE donde pueda comenzar a ingresar su shell y comandos de Git.

1.Haga clic en el menú Terminal a la derecha de este panel de instrucciones y luego haga clic en Nueva
Terminal.
2.Esto agregará una nueva ventana de terminal en la parte inferior donde podrá comenzar a ingresar
comandos.

Ejercicio 1: crear un nuevo repositorio local


1. Cree un directorio myrepo ejecutando el comando mkdir que se proporciona a continuación en la
terminal.
mkdir myrepo
2. Vaya al directorio myrepo ejecutando el siguiente comando.
cd myrepo
3. Inicie el directorio myrepo como un repositorio git usando el comando git init.
git init
4. Un repositorio git local ahora se inicia con una carpeta .git que contiene todos los archivos git, que puede
verificar haciendo una lista de directorios ejecutando el siguiente comando en la ventana del terminal. El .
El prefijo ocultará el directorio git. La opción -la muestra una lista larga, incluido el permiso de acceso, la
hora de creación y otros detalles de todos los archivos en el directorio oculto de git.
ls -la .git
El resultado muestra el contenido del subdirectorio .git que contiene toda la información requerida por el
servidor git.

Ejercicio 2: crear y agregar un archivo al repositorio local


1. Ahora cree un archivo vacío llamado nuevo archivo usando el siguiente comando TOUCH.
touch newfile
2. Agregue este archivo al repositorio usando el siguiente comando git add.
git add newfile

Ejercicio 3: confirmar cambios


1. Antes de realizar los cambios, debes decirle a Git quién eres. Puedes hacer esto usando los siguientes
comandos. Reemplace "[email protected]" con la dirección de correo electrónico que utiliza para
iniciar sesión en GitHub. Reemplace "Su nombre" con su nombre.
Tenga en cuenta que el correo electrónico y el nombre deben estar entre comillas.
× git config --global user.email [email protected]
× git config --global user.name "Your Name"
2. Ahora puede confirmar sus cambios usando el siguiente comando git commit.
Tenga en cuenta que la confirmación requiere un mensaje, que puede incluir utilizando el parámetro -m.
× git commit -m "added newfile"

Ejercicio 4: crear una rama


1. Su confirmación anterior creó una rama principal predeterminada llamada master.

2. Para realizar cambios posteriores en su repositorio, cree una nueva rama en su repositorio local.
Ejecute el siguiente comando git branch en la terminal para crear una rama llamada my1stbranch.
× git branch my1stbranch

Ejercicio 5: Obtener una lista de sucursales y sucursales activas


1. Verifique la lista de ramas que contiene su repositorio ejecutando el siguiente comando git branch.
× git branch
2. Tenga en cuenta que el resultado enumera dos ramas: la rama MASTER predeterminada con un asterisco
* al lado que indica que es la rama actualmente activa y la rama mys1stbranch recién creada.

Ejercicio 6: cambiar a una rama diferente


1. Como ahora desea trabajar en la nueva rama para realizar cambios, ejecute el siguiente comando git
checkout para convertirla en la rama activa.
git checkout my1stbranch
2. Verifique que la nueva rama sea ahora la rama activa ejecutando el siguiente comando git branch.
git branch
3. Tenga en cuenta que el asterisco * ahora está al lado de my1stbranch, lo que indica que ahora está
activo.

Como atajo, en lugar de crear una rama usando git branch y luego activarla usando git checkout,
puedes usar el comando git checkout seguido de la opción -b, que crea la rama y la activa en un solo
paso.
git checkout -b my1stbranch

Ejercicio 7: realice cambios en su sucursal y verifique el estado de los


archivos agregados o modificados
1. Realice algunos cambios en su nueva rama, llamada my1stbranch. Comience agregando texto al
newfile ejecutando el siguiente comando en la terminal que agregará la cadena "Aquí hay texto en mi
archivo nuevo". en el archivo.
echo 'Here is some text in my newfile.' >> newfile
2. Verifique que se haya agregado el texto ejecutando el siguiente comando cat.
cat newfile

3. Ahora, cree otro archivo llamado readme.md usando el siguiente comando.


touch readme.md
4. Y ahora, agréguelo al repositorio con el siguiente comando git add.
git add readme.md
5. Hasta ahora, en su nueva rama, editó el newfile y agregó un archivo llamado readme.md. Puede
verificar fácilmente los cambios en su rama actual usando el comando git status.
git status
6. El resultado del comando git status muestra que el archivo readme.md se agregó a la rama y está listo
para confirmarse desde que lo agregó a la rama usando git add. Sin embargo, aunque modificó el
archivo llamado newfile, no lo agregó explícitamente usando git add y, por lo tanto, no está listo para
confirmarse.
7. Un atajo para agregar todas las modificaciones y adiciones es usar el siguiente comando git add con
un asterisco *. Esto también agregará el archivo modificado newfile a la rama y lo dejará listo para ser
confirmado.
git add *
8. Comprobemos el estado nuevamente.
git status
9. El resultado ahora muestra que ambos archivos ahora se pueden confirmar.

Ejercicio 8: confirmar y revisar el historial de confirmaciones


1. Ahora que sus cambios están listos, puede guardarlos en la rama usando el siguiente comando de
confirmación con un mensaje que indica los cambios.
git commit -m "added readme.md modified newfile"
2. Podemos ejecutar el siguiente comando git log para obtener un historial de confirmaciones recientes:
git log
3. El registro muestra dos confirmaciones recientes: la última confirmación con my1stbranch y la
confirmación anterior con master.

Nota: Para salir del comando git log, simplemente presione la tecla "Q". Esta acción cerrará la vista de
registro y lo llevará nuevamente al símbolo del sistema.

Ejercicio 9: revertir los cambios confirmados


1. A veces, es posible que no pruebe completamente los cambios antes de realizarlos, lo que puede
tener consecuencias no deseadas. Puede revertir sus cambios usando un comando git revert como el
siguiente.

Puede especificar el ID de su confirmación que puede ver en la salida del registro anterior o usar el
acceso directo HEAD para revertir la última confirmación:
git revert HEAD --no-edit

NOTA: Si no especifica el indicador --no-edit, es posible que se le presente una pantalla del editor que
muestra el mensaje con los cambios que se deben revertir. En ese caso, presione la tecla Control (o
Ctrl) simultáneamente con X.

2. El resultado muestra que se ha revertido la confirmación más reciente con la identificación


especificada.
Ejercicio 10: fusionar cambios en otra rama
1. Hagamos un cambio más en su my1stbranch actualmente activa usando los siguientes comandos.
touch goodfile
git add goodfile
git commit -m "added goodfile"
git log

2. El resultado del registro muestra que el goodfile recién agregado se ha enviado a la rama
my1stbranch:

Nota: Para salir del comando git log, simplemente presione la tecla "Q". Esta acción cerrará la vista de
registro y lo llevará nuevamente al símbolo del sistema.

3. Ahora, fusionemos el contenido de my1stbranch en la rama master. Primero necesitaremos activar la


rama maestra usando el siguiente comando git checkout.
git checkout master

4. Ahora, fusionemos los cambios de my1stbranch en master.


git merge my1stbranch
git log

5. La salida y el registro muestran la fusión exitosa de la rama.

6. Ahora que los cambios se han fusionado en la rama maestra, my1stbranch se puede eliminar usando
el siguiente comando git branch con la opción -d:
git branch -d my1stbranch

Ejercicio 11: Practica por tu cuenta


1. Cree un nuevo directorio y rama llamado newbranch
2. Hacer de newbranch la rama activa
3. Crea un archivo vacío llamado newbranchfile
4. Agregue el archivo recién creado a su rama
5. Confirme los cambios en su newbranch
6. Revertir los últimos cambios confirmados
7. Crea un nuevo archivo llamado newgoodfile
8. Agregue el archivo más reciente a newbranch
9. Confirmar los cambios
10. Fusionar los cambios en newbranch en master
Resumen
En esta práctica de laboratorio, aprendió a crear y trabajar con ramas usando comandos de Git en un
repositorio local. En una práctica de laboratorio posterior, aprenderá cómo sincronizar los cambios en su
repositorio local con repositorios remotos de GitHub.

3. Modulo 5 Resumen y Evaluaciones


3.1. Resumen del módulo 5
[…]
¡Enhorabuena! Ha completado este módulo. A estas alturas del curso, usted conoce
▪ Las capacidades de R y sus usos en la Ciencia de Datos.

▪ La interfaz RStudio para ejecutar códigos R.

▪ Paquetes populares de R para la Ciencia de Datos.

▪ Paquetes populares de visualización de datos en R.

▪ Trazado con la función de trazado incorporada en R.

▪ Trazado con ggplot.

▪ Añadir títulos y cambiar los nombres de los ejes utilizando la función ggtitle y lab's.

▪ Un sistema de control de versiones distribuido (DVCS) realiza un seguimiento de los cambios en el


código, independientemente de dónde esté almacenado.

▪ El control de versiones permite que varios usuarios trabajen en la misma base de código o
repositorio, replicando la base de código en sus propios ordenadores si es necesario, mientras que el
software de control de versiones distribuido ayuda a gestionar la sincronización entre las distintas
réplicas de la base de código.

▪ Los repositorios son estructuras de almacenamiento que

o Almacenan el código
o Realizan un seguimiento de las incidencias y los cambios
o Permiten colaborar con otros

▪ Git es uno de los sistemas distribuidos de control de versiones más populares.

▪ GitHub, GitLab y Bitbucket son ejemplos de sistemas de control de versiones alojados.

▪ Las ramas se utilizan para aislar los cambios en el código. Cuando los cambios están completos,
pueden fusionarse de nuevo en la rama principal.

▪ Los repositorios pueden clonarse para poder trabajar localmente y luego sincronizar los cambios con
el original.
3.2. Glosario
[…]
Termino
Apache MLib
Apache Spark
API
Caffe
CDLA
Classification models
CLI
C++
Data set
Deeplearning4
Deep learning
ELT
ETL
FSF
ggplot2
GPU
Git
Hadoop
Java
Java-ML
JVM
JavaScript
Julia
Jupyter Notebook
Jupyter Lab

3.3. Cuestionario práctico – RStudio


[…]
1.
Pregunta 1
¿Dónde puede escribir los comandos de R en RStudio?
A. Editor de código
B. Consola
C. Archivos
D. Historia

2.
Pregunta 2
¿Qué biblioteca de R utilizará para visualizaciones de datos como histogramas, gráficos de barras y diagramas
de dispersión? Seleccione todas las que correspondan.
A. ggplot
B. Leaflet
C. Lattice
D. Plotly

3.
Pregunta 3
¿Cuál es el comando utilizado para instalar paquetes en R?
A. installpackages()
B. biblioteca(paquetes)
C. install.packages()

3.4. Prueba práctica – GitHub


[…]
1.
Pregunta 1
¿Qué término describe las carpetas configuradas para el control de versiones?
A. Fork (Horquilla)
B. Repository (Requisitorio)
C. Pull request (Solicitud de Extracción)
D. SSH protocol (Protocolo SSH)

2.
Pregunta 2
¿Qué pestaña de su repositorio permite revisar los cambios realizados antes de ser fusionados en la rama
principal?
Proyectos
Problemas
Solicitudes de extracción
Código

3.
Pregunta 3
¿Qué comando se utiliza para clonar un repositorio existente?
git clone
git add
estado git
git reset

3.5. Cuestionario graduado - RStudio y GitHub


[…]
1.
Pregunta 1
¿Cuál de las siguientes afirmaciones es cierta sobre el lenguaje R?
A. R soporta la importación de datos de diferentes fuentes como archivos planos, bases de datos
B. R se utiliza para la inferencia estadística y no admite la visualización
C. Las funciones de R requieren mucha codificación en comparación con otras herramientas de ciencia
de datos
D. R requiere la instalación de bibliotecas adicionales para manejar el análisis de datos

2.
Pregunta 2
¿Qué biblioteca de R se utiliza para el aprendizaje automát
A. caret
B. dplyr
C. stringr
D. ggplot

3.
Pregunta 3
¿Qué función de ggplot añade un título al gráfico?
A. biblioteca
B. punto geom
C. ggplot
D. ggtitle

4.
Pregunta 4
¿Qué función se utiliza para especificar nombres apropiados para ambos ejes en un gráfi
A. biblioteca
B. xlab e ylab
C. punto geom
D. ggplot

5.
Pregunta 5
¿Qué es una copia de un depósito
A. Horquilla
B. Protocolo SSH
C. Solicitud de extracción
D. Directorio de trabajo

6.
Pregunta 6
¿Cómo permite GitHub agilizar las pruebas y la entrega?
A. Con integración continua (CI) y entrega continua (CD) incorporadas
B. Con revisar e incluir comentarios
C. Con la fusión
D. Con ramificación

7.
Pregunta 7
En GitHub, ¿qué es una organización?
A. Un nombre que debe especificar para su repositorio
B. El nivel superior de un árbol de repositorios
C. Una ruta a los archivos de código de un proyecto
D. Una colección de cuentas de usuario propietarias de repositorios

8.
Pregunta 8
¿En qué pestaña del repositorio puede ver todos los archivos fuente?
A. Código
B. Cuestiones
C. Solicitudes de extracción
D. Proyectos

9.
Pregunta 9
¿Cómo se guardan los cambios en el repositorio?
A. Crear un nuevo archivo
B. Comprometer cambios
C. Guardar cambios
D. Añadir archivo

10.
Pregunta 10
¿Qué opción le permite añadir un archivo al repositorio desde su máquina local?
A. Crear un nuevo archivo
B. Cargar archivos
C. Comprometer cambios
D. Nuevo repositorio

También podría gustarte