R
Esteban Santamaria Rodríguez
Jair Antonio Vergel Arenas
Sergio Aramis Villanueva Hernández
Minería de datos
Tabla de Contenidos
1. Introducción
2. Historia
3. Evolución
4. Características y Funciones
5. Plataformas y Extensiones
6. Interfaz grafica
Introducción
R nació como una
reimplementación de software
libre del lenguaje S, adicionado
con soporte para ámbito estático.
Se trata de uno de los lenguajes
de programación más utilizados
en investigación científica, siendo
además muy popular en los
campos de aprendizaje
automático (machine
learning), minería de
datos, investigación
biomédica, bioinformática y mate
máticas financieras.
Historia
R fue creado en 1992 en Nueva Zelanda por Ross Ihaka y Robert Gentle-
man. La intención inicial con R, era hacer un lenguaje didáctico,
para ser utilizado en el curso de Introducción a la Estadística de la Universi-
dad de Nueva Zelanda. Para ello decidieron adoptar la sintaxis del lenguaje
S desarrollado por Bell Laboratories.
A modo de broma Ross y Robert, comienzan a llamar “R” al lenguaje que
implementaron, por las iniciales de sus nombres, y desde entonces así se le
conoce en la muy extendida comunidad amante de dicho lenguaje.
Evolución
Luego de la creación de R
(en 1992), se da un primer anuncio al público del software R en 1993. En el año
de 1995 Martin Mächler, de la Escuela Politécnica Federal de Zúrich, convence
a Ross y Robert a usar la Licencia GNU para hacer de R un software libre.
Como consecuencia, a partir de 1997, R forma parte del proyecto GNU.
Sobre la base de la distribución de R, bajo Licencia Pública General GNU, que
realizaron sus creadores, surgió a su alrededor una amplia comunidad de usuarios,
que, de manera desinteresada, comenzaron a desarrollar y publicar distintas rutinas y
librerías (macros) que facilitaban la realización de procesos recurrentes a la hora de
trabajar con este lenguaje de programación.
Características
Funciones
• R es un entorno de programación que ejecuta paquetes
estadísticos con muchas herramientas
• Cuenta con una herramienta que grafica los datos
• Trabaja con objetos.
• Puede integrarse con distintas bases de datos y existen
bibliotecas que facilitan su utilización desde lenguajes de
programación interpretados como Perl y Python.
• R también puede usarse como herramienta de cálculo
numérico
Características
R versión 4.0.2 se lanzó el 2020-06-22
• Posee una gran catidad de interfaces graficas desarrolladas por
usuarios. La más usada es jrg escrita en java.
• Es soportado por varias IDES como eclipse, notepad++ visual
studio, bluefish y Rstudio.
• permite una carga rápida de datos con un coste de memoria
mínimo.
• Soporte para sistemas Windows de 64 bits,
Macintosh, Unix y GNU/Linux.
Pertenece a la gran familia
de software libre.
Utiliza licencias GNU
https://www.r-project.org/
Campos a los que R se
puede aplicar
muy popular en los campos
de aprendizaje automático
(machine learning), minería de
datos, investigación
biomédica, bioinformática y matem
áticas financieras. A esto
contribuye la posibilidad de cargar
diferentes bibliotecas o paquetes
con funcionalidades de cálculo y
graficación.
Plataformas y Extensiones
Plataformas
R se está desarrollando para las familias de
sistemas operativos Unix- como, Windows y
Mac.
Plataformas y Extensiones
Plataformas
Plataformas y Extensiones
Extensiones
http://cran.r-project.org/web/packages/
DMwR
Functions and data for "Data Mining with R"
DMwR2
Functions and Data for the Second Edition of "Data Mining
with R"
Hay 16.167 paquetes disponibles.
Interfaz gráfica
Interfaz gráfica
A continuación la interfaz de RStudio, que
básicamente se trata de una máscara para
visualizar el software que tiene como principales
ventajas el orden y la visualización de los procesos
que son llevados a cabo con R, todo de manera
simultánea.
Interfaz gráfica
Interfaz gráfica
Interfaz gráfica
Ventana (1): es el editor de sintaxis: se trata del lugar
donde editamos la sintaxis para posteriormente
ejecutarla. Al escribir allí no sucederá nada, a no ser que
se apriete algún botón para ejecutar los comandos o la
tecla ctrl+enter.
Interfaz gráfica
Interfaz gráfica
Ventana (2): es el “entorno de trabajo” del programa: en
este lugar se muestra el conjunto de datos y los “objetos”
(resultados, variables, gráficos, etc.) que se almacenan al
ejecutar diferentes análisis.
Interfaz gráfica
Interfaz gráfica
Ventana (3) tiene varias sub pestañas: (i) la pestaña files
permite ver el historial de archivos trabajados con el
programa; (ii) la pestaña plots permite visualizar los
gráficos que se generen; (iii) la pestaña packages permite
ver los paquetes descargados y guardados en el disco
duro así como gestionar su instalación o actualización; (iv)
la ventana help permite acceder al CRAN –
Comprehensive R Archive Network (siempre que se
cuente con conexión a Internet); (v) la ventana viewer
muestra los resultados al construir reportes mediante
funcionalidades tipo rmarkdown.
Interfaz gráfica
Interfaz gráfica
Ventana (4): es la consola. Corresponde a
lo que sería el software R en su versión
básica. Allí el software ejecuta las
operaciones realizadas desde el editor de
sintaxis.
Webgrafía
Acerca de R
https://www.r-project.org/