Historia e instalación del programa R & RStudio
Gráficas de barras apiladas en Excel y R & RStudio
Trabajo elaborado por:
Laura Catalina Becerra Ramírez - 617503
Yeraldy Villota Londoño - 617546
Universidad Nacional de Colombia Sede Palmira
Facultad de Ingeniería y Administración
Administración de Empresas
Probabilidad y Estadística
2019
1
Historia e instalación del programa R & RStudio
Gráficas de barras apiladas en Excel y R & RStudio
Trabajo elaborado por:
Laura Catalina Becerra Ramírez - 617503
Yeraldy Villota Londoño - 617546
Trabajo presentado a:
Docente. Viviana Vargas
Universidad Nacional de Colombia Sede Palmira
Facultad de Ingeniería y Administración
Administración de Empresas
Probabilidad y Estadística
2019
2
CONTENIDO
Introducción…………………………………………………………………….. 4
Objetivos………………………………………………………………………… 5
o Objetivo General………………………………………………………. 5
o Objetivos Específicos……………………………………………………
5
R y RStudio…………………………………………………………………………
6
o Concepto…………………………………………………………………
6
o Características…………………………………………………………
6
Historia…………………………………………………………………………..
7
¿Qué es R? ……………………………………………………………………..
9
¿Qué es RStudio? …………………………………………………………………
Instalación de R y RStudio…………………………………………………… 9
o Instalación de R……………………………………………………… 10
o Instalación de RStudio………………………………………………… 16
Grafica de barras apiladas en Excel y RStudio …………………………… 21
o Graficas de barras apiladas en RStudio………………………………22
o Grafica de barras apiladas en Excel………………………………… 27
Conclusión………………………………………………………………………
37
Bibliografía………………………………………………………………………
38
3
INTRODUCCIÓN
El presente manual forma parte fundamental del desarrollo integrado en el lenguaje de
programación en este caso R & RStudio, los cuales son elementos esenciales para la
ejecución de estadísticas y gráficas.
El manual de instalación y configuración del programa R & RStudio que se verá a
continuación nos proporciona instrucciones claras que facilitan el proceso de instalación
con explicaciones que van de la mano con cada paso.
La primera parte, consiste en una breve definición y descripción de la historia de R &
RStudio. La segunda, presenta la instalación del programa R con las debidas
instrucciones en los cuales, cada paso está guiado con una breve explicación al igual
que la instalación del programa RStudio. Por último, una tercera parte nos muestra cómo
realizar y desarrollar gráficas apiladas tanto en Excel como en R & RStudio.
Es importante mencionar que el programa tiene varias versiones las cuales a través del
tiempo han presentado actualizaciones que facilitan el manejo de este, por lo que es
recomendable que el presente manual se perfeccione y actualice constantemente.
4
OBJETIVOS
OBJETIVO GENERAL
● Instalar y familiarizarse con el entorno y la historia de R & RStudio y realización
de gráficas apiladas en este.
OBJETIVOS ESPECÍFICOS
● Aprender la historia del transcurso del programa de R & RStudio para
familiarizarse con este.
● Instalar el programa R & RStudio.
● Realizar gráficas apiladas en el programa R & RStudio y en Excel.
5
HISTORIA DE R & RSTUDIO
Concepto
RStudio es un entorno de desarrollo integrado (IDE) para el
lenguaje de programación R, dedicado a la computación
estadística y gráficos. Incluye una consola, editor de
sintaxis que apoya la ejecución de código, así como
herramientas para el trazado, la depuración y la gestión del
espacio de trabajo.
RStudio está disponible para Windows, Mac y Linux o para
navegadores conectados a RStudio Server o RStudio Server Pro.
RStudio tiene la misión de proporcionar el entorno informático estadístico R. Permite un
análisis y desarrollo para que cualquiera pueda analizar los datos con R.
Características
IDE construido exclusivo para R
● El resaltado de sintaxis, auto completado de código y sangría inteligente.
● Ejecutar código R directamente desde el editor de código fuente.
● Salto rápido a las funciones definidas.
Colaboración
● Documentación y soporte integrado.
● Administración sencilla de múltiples directorios de trabajo mediante
proyectos.
● Navegación en espacios de trabajo y visor de datos.
6
Potente autoría y depuración.
● Depurador interactivo para diagnosticar y corregir los errores rápidamente.
● Herramientas de desarrollo extensas.
● Autoría con Sweave y R Markdown.
HISTORIA
R nació como una reimplementación de software
libre del lenguaje S, adicionado con soporte para
alcance estático, un lenguaje de programación
creado en los Laboratorios Bell de Estados Unidos,
los mismos laboratorios que inventaron el
transistor, el láser, el sistema operativo Unix y
algunas otras cosas más.
Dado que S y sus estándares son propiedad de los Laboratorios Bell, lo cual restringe su
uso, Ross Ihaka y Robert Gentleman, de la Universidad de Auckland en Nueva Zelanda,
decidieron crear una implementación abierta y gratuita de S. Este trabajo, que culminaría
en la creación de R inició en 1992, teniendo una versión inicial del lenguaje en 1995 y en
el 2000 una versión final estable.
R hereda muchas características de S, por lo que se puede correr el código de este
lenguaje usando R sin mayor problema. Para lograr esto, en R frecuentemente existe
más de una manera de realizar tareas comunes, una compatible con S y otra diseñada
específicamente para R. Lo anterior tiene como resultado inconsistencias, sintaxis poco
intuitiva y abundante frustración de cabeza para las personas que quieren aprender R.
Actualmente, el mantenimiento y desarrollo de R es realizado por el R Development Core
Team, un equipo de especialistas en ciencias computacionales y estadística
provenientes de diferentes instituciones y lugares alrededor del mundo. La versión de R
mantenida por este equipo es conocida como “base” y como su nombre indica, es sobre
aquella que se crean otras implementaciones de R así como los paquetes que expanden
su funcionalidad.
7
Para lograr que R sea usado sin restricciones es distribuido de manera gratuita, a través
de la Licencia Pública General de GNU, por lo que es software libre y de código abierto.
Si lo deseas, puedes examinar y estudiar el código que hace que R funcione o puedes
crear versiones propias de R que se ajusten a tus necesidades particulares. Esta licencia
también te permite usar R para los fines que desees, sin limitaciones, ya sean
personales, académicos o comerciales.
En la actualidad, el desarrollo de este lenguaje de programación se mantiene activa. La
versión más reciente de R al momento de escribir este documento es la 3.6.0 que fue
publicada en abril del 2019 y diariamente son publicados nuevos paquetes y sus
respectivas actualizaciones.
Aunque R está diseñado para análisis estadístico, con el paso del tiempo los usuarios de
este lenguaje han creado extensiones a R, llamadas paquetes, que han ampliado su
funcionalidad. En la actualidad es posible realizar en R minería de textos, procesamiento
de imagen, visualizaciones interactivas de datos y procesamiento de Big Data, entre
muchas otras cosas.
8
¿QUÉ ES R?
R es un proyecto de software libre de GNU y se
podría definir desde dos puntos de vista, por
una parte es un lenguaje de programación y por
otra un entorno de trabajo, estando ambos
orientados al cálculo estadístico y a la
generación de gráficas.
Como lenguaje de programación proporciona
una amplia variedad de técnicas y recursos
para el trabajo con gráficas y análisis estadístico y, a su vez, es altamente ampliable.
Cuenta con una comunidad extensa de desarrolladores, investigadores y usuarios. Se
distribuye con licencia GNU GPL v2 y está disponible para distintos sistemas operativos
de tipo Unix y similares (FreeBSD y Linux), Windows y Mac OS.
Como entorno de trabajo se entiende como un sistema totalmente planificado y
coherente y no una acumulación incremental de herramientas muy específicas y poco
flexibles, como es frecuentemente el caso con otro software de análisis de datos. En este
caso el entorno de trabajo R nos proporciona una serie de utilidades para manipulación
de datos, cálculo y representación gráfica.
¿QUÉ ES RSTUDIO?
RStudio es un entorno de
desarrollo integrado (IDE) para R.
Es software libre con licencia
GPLv3 y se puede ejecutar sobre
distintas plataformas (Windows,
Mac, or Linux) o incluso desde la
web usando RStudio Server.
9
INSTALACIÓN DE R Y RSTUDIO (EN WINDOWS).
Aunque Windows no es software libre, pero R y RStudio sí lo son. Se debe tener en
cuenta los siguientes pasos para instalar el programa:
A. INSTALACIÓN DE R:
Para instalar R descargamos del sitio oficial de R
la última revisión estable, la 3.6.0, pulsando en
Windows (en la mayoría de los casos).
PRIMER
PASO [Link]
[Link]/bin/windows/base/
SEGUNDO
PASO
Escoge la versión
3.6.1 que se acople
al sistema operativo
de tu computador.
10
Haciendo doble click sobre el fichero después de
terminar la descarga comenzamos la instalación. Saldrá
el típico aviso de Windows de que no se puede
TERCER comprobar el editor, no le hacemos caso y pulsamos en
PASO EJECUTAR. A veces también sale otra ventana
indicando que hay que permitir la ejecución del paquete
ya que requiere privilegios de administrador.
CUARTO
PASO
Seleccionamos el
idioma a convenir y le
damos en ACEPTAR 11
QUINTO
PASO
Después nos informa sobre el
tipo de licencia, le damos pulsar
en SIGUIENTE
SEXTO
PASO
A continuación nos indica la ruta
de instalación, le damos en
SIGUIENTE.
12
SÉPTIMO
PASO
Ahora seleccionamos los
paquetes a instalar, por lo
general ya vienen
seleccionados, le damos
en SIGUIENTE.
OCTAVO
PASO
Después nos pregunta si
queremos usar las opciones
de configuración, damos en
SIGUIENTE
13
NOVENO
PASO
Elegimos la carpeta
donde colocar los
accesos directos a los
elementos del paquete,
damos SIGUIENTE
DECIMO
PASO
Selección de tareas
adicionales: Crear icono
en el escritorio y le damos
en SIGUIENTE
14
UNCEAVO
PASO
Se procede a iniciar el
desempaquetado e instalar la
aplicación
DOCEAVO
Una vez finalizada el proceso PASO
de instalación sale una
ventana indicándolo. Pulsar
FINALIZAR.
Ya nos aparecerá el
correspondiente icono en el
escritorio.
15
B. INSTALACIÓN DE RSTUDIO
Ahora voy a instalar RStudio, para ello descargo la
última versión estable (1.2 en estos momentos) del
sitio oficial de RStudio.
PRIMER
PASO
[Link]
io/download/
Escogemos la opción
RStudio 1.2.1335 -
Windows 7+ (64 bits)
SEGUNDO
PASO
16
Haciendo doble click sobre el fichero
después de terminar la descarga
comenzamos la instalación. Saldrá el
típico aviso de Windows de que no se
puede comprobar el editor, no le
hacemos caso y pulsamos en
EJECUTAR. A veces también sale otra
ventana indicando que hay que permitir
la ejecución del paquete ya que requiere
privilegios de administrador.
TERCER
PASO
A continuación, nos
aparece el asistente de
instalación, pulsamos
“Siguiente”.
17
CUARTO
PASO
Luego nos pide la ruta
de instalación,
pulsamos “Siguiente”.
QUINTO
PASO
Elegir la carpeta del menú
inicio donde colocar los
accesos directos a los
elementos del paquete,
pulsar Instalar.
18
SEXTO
PASO
Comienza la instalación que dura
aproximadamente un minuto y
esperamos que culmine.
SÉPTIMO
PASO
Para finalizar aparece el
asistente indicando que ha
finalizado la instalación.
Pulsamos “Terminar”.
19
Así nos aparecerá el ícono en el
escritorio.
Y al ingresar al programa RStudio,
OCTAVO su inicio nos aparecerá de esta
PASO manera.
20
GRÁFICAS DE BARRAS APILADAS EN EXCEL Y R~STUDIO
Descripción
En un gráfico de barras apiladas, las barras se dividen en segmentos de barra coloreados
que se colocan unos encima de otros. La altura total de una barra muestra el valor
numérico de una categoría determinada, mientras que la altura de los segmentos de
barra representa la contribución de los distintos componentes a ese valor.
A diferencia de un gráfico de barras de conjunto múltiple que muestra sus barras al lado,
los gráficos de barras apiladas segmentan sus barras de múltiples conjuntos de datos
una encima de la otra. Se utilizan para mostrar cómo una categoría más grande se divide
en categorías más pequeñas y cuál es la relación de cada parte sobre la cantidad total.
Hay dos tipos de gráficos de barras apiladas:
Los gráficos de barras apiladas simples colocan cada valor de un segmento al
lado del anterior. El valor total de la barra es todo el segmento de valores
agregados. Es ideal para comparar las cantidades totales a través de cada
grupo/barra segmentada.
Los gráficos de barras apiladas 100 % muestran el porcentaje de la totalidad de
cada grupo y se representan por el porcentaje de cada valor frente a la cantidad
total en cada grupo. Esto hace que sea más fácil ver las diferencias relativas entre
las cantidades en cada grupo.
Un fallo importante de los gráficos de barras apiladas es que se vuelven más difíciles de
leer cuantos más segmentos tiene cada barra. Además, comparar cada segmento entre
sí es difícil, ya que no están alineados en una línea de base común.
21
PASOS PARA REALIZAR GRÁFICAS APILADAS EN R Y RSTUDIO
A continuación le presentaremos una base de datos como ejemplo para realizar la
respectiva grafica apilada en el programa Rstudio.
PRIMER
PASO
Nos dirigimos a la
opción “Packages” y
después
seleccionamos la
opción “Install”
22
SEGUNDO
PASO
Digitamos el paquete de
“ggplot2” y procedemos a
Instalar
Después de haber instalado el paquete de
“ggplot2”, procedemos a activarlo,
seleccionamos el paquete de las opciones
de la librería y en la consola nos debe
TERCER aparece “library (ggplot2)”
PASO
23
1
CUARTO
PASO
En la imagen 3 se
2
puede observar como
el programa nos ha
Procedemos a digitar las
creado las variables variables de nuestra base de
en una tabla. datos como aparece en la
imagen 1, después
seleccionamos la opción “Run”
para que nos crea las variables
3 en el programa Rstudio como se
observa en la imagen 2.
QUINTO
PASO
Digitamos los siguientes comandos para pasar a
crear la gráfica apilada con sus unidades en
toneladas, sus coordenadas de X y Y con sus
respectivos colores. Después seleccionamos “Run”. 24
SEXTO
PASO
Para cambiarle el color a las
barras, digitamos los
comandos del paso anterior
solo que colocamos
diferentes colores en inglés,
los que usted prefiera.
Después seleccionamos
“Run”.
25
SEPTIMO
PASO
Otra manera de crear la gráfica de barras apiladas
es de forma porcentual, digitamos los siguientes
comandos para pasar a crear la gráfica con sus
unidades en Porcentaje, sus coordenadas de X y Y
con sus respectivos colores. Después
seleccionamos “Run”.
26
PASOS PARA REALIZAR GRÁFICAS APILADAS Y AGRUPADAS EN EXCEL
Tener presente los datos de partida que necesitamos
usar, los cuales están ubicados en una tabla como la
siguiente:
PRIMER
PASO
Queremos que los valores de los años desde el 2010 hasta el 2017 sean una misma columna apilada
y el valor Suma sea la columna agrupada paralela.
Seleccionamos los datos de la tabla y nos vamos a “insertar” e insertamos un gráfico tipo columna
apiladas como se muestra en la siguiente imagen:
SEGUNDO
PASO
27
Como necesitamos que la información presentada, esté explícita proseguimos de la
siguiente manera.
SEGUNDO
PASO
Organizamos la tabla de datos como puede verse en la
siguiente imagen:
(Cada una de las filas representa una de las barras apiladas
del gráfico que vamos a poner a continuación.)
28
Seleccionamos todos los valores numéricos incluidos las cabeceras e
insertamos un gráfico de barras apiladas. Como puedes ver en la
siguiente imagen la distribución es la misma que habíamos comentado
en el gráfico anterior.
TERCER
PASO
Como se logra observar, en las filas de la tabla donde
habíamos indicado «Nada» no se ha dibujado ninguna barra.
En las que habíamos indicado «Apilada» tenemos las barras
de diversos colores y en la que indicamos «Acumulada» tenemos la barra gris, la cual
hace referencia al total de los cultivos agropecuarios como indica nuestro ejemplo.
29
Para que el efecto de comparación de las dos barras quede
bien deberemos ampliar el grosor de las mismas. Para ello
seleccionamos una barra cualquiera y hacemos click con el
botón derecho. Seleccionamos la opción «Dar formato a
serie de datos…».
CUARTO
PASO
Automáticamente en el panel de la derecha de Excel nos aparecerá un cuadro con
opciones del gráfico. En este cuadro deberemos modificar el «Ancho del intervalo»
como puede verse en la siguiente imagen:
Y lo pondremos en el valor 0%. De esta manera las barras del gráfico se habrán
ampliado hasta estar tocándose.
30
QUINTO
PASO
Para poner en el eje horizontal las etiquetas que queramos deberemos
hacerlo añadiendo una nueva serie. Esta nueva serie está formada por los
nombres de las categorías y por los valores 0. Vayamos paso por paso
para entenderlo mejor.
Previamente añadiremos una columna auxiliar a nuestra tabla inicial como
puede verse en la siguiente tabla de Excel:
2
1
31
Después, como podemos observar en los pasos 1,2 y 3 anteriores; añadiremos esta
nueva serie auxiliar a nuestro gráfico.
Para añadir una nueva serie al gráfico hacemos click con el botón derecho sobre el
gráfico y elegimos la opción «Seleccionar datos». Después, en el recuadro de la derecha
seleccionamos la opción «Agregar». El nombre de la serie será «Auxiliar» y los valores
serán 0, 0, 0, 0, 0, 0, 0; para nuestro ejemplo.
Cambiar tipo de gráfico de la serie auxiliar.
Para ello seleccionamos una barra cualquier del gráfico de
columnas apiladas y agregadas que estamos creando. Hacemos
click sobre dicha barra con el botón derecho y seleccionamos la
opción «Cambiar tipo de gráfico de series…». Inmediatamente
aparecerá una ventana como la siguiente:
SEXTO
PASO
En la serie «Auxiliar» hemos
cambiado el tipo de gráfico a «Línea
con marcadores» y hemos
seleccionado la opción de «Eje
secundario».
32
Añadir etiquetas a la serie auxiliar.
Volvemos a hacer click sobre el gráfico y elegimos la opción de
«Seleccionar datos». En el recuadro de la izquierda seleccionamos
la serie «Auxiliar y en el recuadro de la derecha seleccionaremos la
opción Editar para poder editar las categorías y seleccionaremos el
rango de las categorías, es decir: 2011, 2012, 2013, etc.
En la siguiente imagen se puede ver la serie seleccionada y el
recuadro de categorías modificado.
SEPTIMO
PASO
Una vez cambiado esto haremos click en «Aceptar». Una
vez hecho esto aparecerá un gráfico como el de la
imagen en el que se ha añadido una línea de puntos en
la parte inferior izquierda del gráfico en Excel y ha
aparecido el Eje vertical secundario.
Añadir el eje horizontal secundario.
Nuevamente seleccionamos el gráfico y en la esquina superior
derecha, donde la cruceta verde que aparece seleccionamos la
opción de «Eje» y marcamos «Horizontal secundario».
OCTAVO
PASO
33
Inmediatamente nos aparecerá en
el gráfico el eje horizontal
secundario que se colocará en la
parte de arriba:
Cambiamos los ejes superior e inferior.
Como el eje superior es el que me indica las categorías del
gráfico, lo quiero bajar a la parte de abajo del gráfico, donde
está los números del 1 al 22. Para ello; damos click con el
botón derecho sobre el mismo y seleccionamos la opción “Dar
formato al eje”. Luego, en las opciones del eje, seleccionar el
desplegable de “Etiquetas” y ahí, en la opción de “Posición de
etiqueta” seleccionar la opción “Bajo” como veremos en las
siguientes imágenes:
NOVENO
PASO
34
Después seleccionar el eje con los números y repito la misma
operación pero en el último paso seleccionamos la «Posición
de etiqueta»: Alto.
Cuadrar el eje horizontal.
Como puedes ver en la siguiente imagen las bolitas no están
perfectamente alineadas con el centro de los gráficos de barras.
Para solucionar este pequeño problema selecciona el eje de
arriba (el que ahora tiene los números). En el desplegable de
«Opciones del eje» selecciona la opción «En marcas de
graduación» para mover los números y colocarlos sobre las
DÉCIMO
supuestas marcas de graduación.
PASO
35
Últimos detalles al gráfico.
Ocultar el eje vertical secundario. Para ello selecciona el eje y
en el grupo de opciones «Etiqueta» selecciona la opción de
«Posición del eje» Ninguno.
Ocultar el eje horizontal superior. Para ello haz lo mismo que
en el paso anterior. Y quita el color de la línea.
Oculta el eje vertical principal (el de la izquierda).
Quita las líneas del fondo (a no ser que sean imprescindibles).
Quita el marco alrededor del gráfico (normalmente no queda
muy bien).
ONCEAVO
Añade los valores de las barras.
PASO
Selecciona la línea auxiliar y en las opciones de «Relleno y
línea» selecciona en «Línea» la opción «Sin línea» y después
en «Marcador» selecciona la opción «Ninguno».
En la leyenda selecciona la palabra «Auxiliar» y bórrala.
Modifica los colores de las barras a tu gusto.
Añade un título interesante al gráfico.
36
CONCLUSIÓN
Se puede concluir, que el presente manual es de gran importancia para la vida
académica y laboral del estudiante y el profesional, ya que brinda herramientas de como
instalar el sistema de programación estadística R & RStudio paso a paso.
Por otro lado, el dominio del manejo del programa en este manual se logra apreciar a
través de la realización del grafico de barras apiladas no solo en el programa RStudio,
sino también en el programa Excel, con ayuda de una serie de pasos que facilitan realizar
su elaboración.
37
BIBLIOGRAFÍA
● Andina, M. (2018). Introducción a estadística con R. Recuperado de:
[Link]
● Arranz, Q. (S.F). Excel & VBA. Recuperado de: [Link]
columnas-apiladas-agrupadas/
● Mendoza, J. (S.F). R para principiantes. Recuperado de:
[Link]
● R. (S.F). The comprehensive R Archive Network. Recuperado de: [Link]
[Link]/
● RStudio. (2018). 250 Northern Ave, Boston, MA 02210. Recuperado de:
[Link]
38