Alumno: Salinas Morales Brayan
software R
1. Definición:
R es un lenguaje de programación que permite realizar análisis de
datos escribiendo scripts y funciones. R es un lenguaje interactivo
orientado a objetos, este ha sido diseñado por estadísticos para los
estadísticos. El lenguaje proporciona objetos, operadores y
funciones que hacen que el proceso de exploración, modelado y
visualización de datos sea natural. Los análisis completos de datos a
menudo pueden ser representados en unas pocas líneas de código.
2. Origen:
Fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka del Departamento de
Estadística de la Universidad de Auckland en 1993. Sin embargo, si se remonta a sus bases
iniciales, puede decirse que se inició en los Bell Laboratories de AT&T y ahora Alcatel-Lucent en
Nueva Jersey con el lenguaje S. Este último, un sistema para el análisis de datos desarrollado por
John Chambers, Rick Becker, y colaboradores diferentes desde finales de 1970. La historia desde
este punto es prácticamente la del lenguaje S. Los diseñadores iniciales, Gentleman y Ihaka,
combinaron las fortalezas de dos lenguajes existentes, S y Scheme. En sus propias palabras: "El
lenguaje resultante es muy similar en apariencia a S, pero en el uso de fondo y la semántica es
derivado desde Scheme". El resultado se llamó R "en parte al reconocimiento de la influencia de S
y en parte para hacer gala de sus propios logros".
Su desarrollo actual es responsabilidad del R Development Core Team.
Crea
dores de R Software Robert Gentleman y Ross Ihaka
3. Uso:
Este software se utiliza para estudiar correlaciones, ajustar modelos, crear gráficos 3D de altísima
calidad, aplicar árboles de decisión, realizar análisis clúster, análisis de componentes principales,
crear redes neuronales de predicción, etc.
La lista de posibilidades es muy pero que muy extensa y se adapta a todo tipo de necesidades para
el análisis complejo de datos.
E
j e
m p
l o
s
de análisis estadísticos con R
4. Ventajas:
Es una herramienta muy poderosa para todo tipo de procesamiento y manipulación de
datos.
Algunas técnicas avanzadas y robustas solo pueden realizarse con este software.
Ambiente de trabajo muy flexible y extensible.
Permite crear gráficos de alta calidad exportables en diversos formatos: PostScript,pdf,
bitmap, pictex, png, jpeg, etc.
Gran cantidad de información sobre sus funciones y paquetes de funciones.
Consume pocos recursos informáticos.
Está disponible para todos los sistemas operativos (Windows, Macintosh y sistemas Unix
-como Linux-).
R trabaja con otros lenguajes y permite leer datos de otros softwares como SPSS, SAS,
Excel, etc.
Puedes crear aplicaciones web interactivas (apps) con la herramienta Shiny.
Puedes crear flujos de trabajo para escribir informes reproductibles y dinámicos y hacerlo
en varios formatos (pdf, word, html).
5. Desventajas:
No soporta gráficos en tres dimensiones o dinámicos. El resultado de cada informe puede
ser algo pobre visualmente y bastante anticuado en comparación con el ofrecido por otros
programas.
Su lentitud le resta efectividad y competitividad. Existen lenguajes de programación más
rápidos que ofrecen una capacidad de respuesta más adecuada.
Los algoritmos no están unificados. Cada uno de ellos se almacena en un paquete
distinto, por lo que hay que ir cambiando de opción para leer los datos obtenidos.
Su origen está en S, un lenguaje de programación bastante anticuado que no ha sabido
adaptarse a los tiempos. Otras alternativas, como Python, son más competitivas.
Debido a la acumulación de opciones, aprender a manejarlo totalmente lleva bastante
tiempo y no siempre es fácil de alcanzar este objetivo. No es la mejor opción para
personas que no tienen cierto conocimiento previo de programación. Incluso
programadores expertos cometen errores en su uso al necesitar una formación concreta
en un lenguaje que tiene pocos puntos en común con otros con los que comparte
objetivos.
Sus restricciones y su incompatibilidad con otros lenguajes de programación impiden que
se pueda usar para crear aplicaciones web.
Acumula todos los datos en una única carpeta que termina ocupando demasiado espacio
en una memoria física. Esta circunstancia conlleva que sea necesario volcar los datos de
forma periódica para evitar el colapso de los dispositivos de almacenamiento.
No tiene medidas de seguridad, por lo que es muy fácil de vulnerar por parte de los
ciberdelincuentes. Poner en riesgo la información personal de los clientes de una empresa
puede provocar la toma de medidas legales que terminen generando un serio problema
económico.
Su actualización constante conlleva tener que aprender las características de cada
apartado continuamente. Así, el analista de los datos no siempre tendrá la seguridad
necesaria al usar un programa en evolución permanente que puede cambiar de un día
para otro.
6. Links:
[Link]
[Link]
[Link]
[Link]
202007/