FUNDAMENTOS DE R
MUNDO DE LA ANALÍTICA DE
DATOS Kenny Cárdenas Parra
¿QUÉ ES R?
Es un lenguaje de programación interpretado, escrito principalmente en C,
Fortran y R mismo, por Ross Ihaka y Robert Gentleman en 1991, bajo la filosofía
Open Source.
Su interprete es distribuido bajo la licencia GNU/GPL y el desarrollo de su
interprete está a cargo de la R foundation, una organización sin ánimo de
lucro que se encarga de compilar y organizar el trabajo de miles de
programadores que trabajan para brindar un software de alta calidad como
lo es R.
¿QUÉ ES UN LENGUAJE INTERPRETADO?
R R R bytecode R virtual
Machine
¿QUÉ ES UN LENGUAJE COMPILADO?
C ++ Compilador Lenguaje de máquina
Lenguaje de Procesador
máquina
VENTAJAS DE R
• Herramienta útil para todo tipo de procesamiento y
manipulación de datos.
• Cuenta con algunas técnicas robustas que solo se
encuentran allí.
• Gran comunidad científica trabajando en su desarrollo.
• Ambiente de trabajo flexible a través de la instalación de
paquetes.
• Disponible para todos los sistemas operativos.
DESVENTAJAS DE R
• No hay soporte técnico ni garantía, debido a ser un
software libre.
• La mayoría de sus usuarios no son programadores, por esto
muchas de sus funciones o rutinas están enfocadas a los
resultados y no al desarrollo de un código claro y rápido.
• Si el código está mal escrito puede tardar mucho en ser
interpretado y ejecutado.
¿R O PYTHON ?
• Los dos son lenguajes de código abierto
• R es un lenguaje que se utiliza para hacer análisis
estadísticos exhaustivos en el campo de las ciencias de
datos.
• Python es un lenguaje de alto nivel multipropósito utilizado
en diversos campos.
• R es más lento en ejecución que Python.
• R es mejor en el procesamiento y visualización de datos.
¿ES R LO MISMO QUE R STUDIO?
Al R ser un lenguaje interpretado, la interacción con sus
funcionalidades suele ser a través de un prompt, el cual no
suele ser muy ameno, pero para poder interactuar de una
mejor manera, se tiene R Studio.
R Studio es un entorno de programación, el cual nos permite
interactuar con R principalmente, pero también con Python,
C, C++, Java, SQL, Shell, Stan entre otros.
¿CÓMO DESCARGAR
R Y RSTUDIO?
Tipo de dato Ejemplo
Lógico – (logi) True, False, T o F
Numerico (numeric) 23.6 TIPOS DE DATOS
Enteros - (int) 20L
Complejos - (cplx) 4 + 4i
Cadena de caracteres - (char) “Hola Mundo”
Not a Number NaN
Not Available NA
Infinito Inf
Lista vacía NULL
OPERADORES
Operador
Suma = “+”
Operador
Resta “-”
Mayor que = “>=”
Multiplicacion = “*”
Menor que “<=”
Division = “/” Mayor = “>”
Potencia = “ˆ” Menor = “<”
Y lógico = “&” Igual = “==”
O lógico = “|” Diferente = “!=”
Negación = “!”
ESTRUCTURAS DE DATOS
• Vectores
• Matrices
• Dataframes
• Listas
• Arrays
PAQUETES
R tiene la propiedad de ser expandible a través de
paquetes. Los paquetes son un conjunto de
funciones diseñadas para atender una necesidad
específica.
Los paquetes se encuentran alojados en CRAN,
pasando por un análisis riguroso antes de estar
disponibles para su uso generalizado.
PAQUETES
R tiene la propiedad de ser expandible a través de
paquetes. Los paquetes son un conjunto de
funciones diseñadas para atender una necesidad
específica.
Los paquetes se encuentran alojados en CRAN,
pasando por un análisis riguroso antes de estar
disponibles para su uso generalizado.