0% encontró este documento útil (0 votos)
11 vistas2 páginas

Syntax Es

El documento es una hoja de referencia que compara tres sintaxis principales en R: la sintaxis de signo peso, la sintaxis de fórmula y la sintaxis del Tidyverse. Se presentan ejemplos de cómo realizar estadísticas de resumen, graficar y manejar datos utilizando cada tipo de sintaxis. Además, se destaca la flexibilidad de R al permitir múltiples formas de expresar el mismo código, lo que facilita el aprendizaje y la aplicación de diferentes enfoques.

Cargado por

carlos riveros
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
11 vistas2 páginas

Syntax Es

El documento es una hoja de referencia que compara tres sintaxis principales en R: la sintaxis de signo peso, la sintaxis de fórmula y la sintaxis del Tidyverse. Se presentan ejemplos de cómo realizar estadísticas de resumen, graficar y manejar datos utilizando cada tipo de sintaxis. Además, se destaca la flexibilidad de R al permitir múltiples formas de expresar el mismo código, lo que facilita el aprendizaje y la aplicación de diferentes enfoques.

Cargado por

carlos riveros
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Comparación de sintaxis de R : : HOJA DE REFERENCIA

Sintaxis de signo peso Sintaxis de fórmula Sintaxis del Tidyverse


objetivo(data$x, data$y) objetivo(y~x|z, data=data, group=w) data %>% objetivo(x)
ESTADÍSTICOS DE RESUMEN: ESTADÍSTICOS DE RESUMEN: ESTADÍSTICOS DE RESUMEN:
una variable continua: una variable continua: una variable continua:
mean(mtcars$mpg) mosaic::mean(~mpg, data=mtcars) mtcars %>% dplyr::summarize(mean(mpg))

una variable categórica: una variable categórica: una variable categórica:


table(mtcars$cyl) mosaic::tally(~cyl, data=mtcars) mtcars %>% dplyr::group_by(cyl) %>%
dplyr::summarize(n()) el pipe
dos variables categóricas: dos variables categóricas:
table(mtcars$cyl, mtcars$am) mosaic::tally(cyl~am, data=mtcars) dos variables categóricas:
mtcars %>% dplyr::group_by(cyl, am) %>%
una continua, una categórica: una continua, una categórica: dplyr::summarize(n())
mean(mtcars$mpg[mtcars$cyl==4]) mosaic::mean(mpg~cyl, data=mtcars)
mean(mtcars$mpg[mtcars$cyl==6]) una continua, una categórica:
mean(mtcars$mpg[mtcars$cyl==8]) mtcars %>% dplyr::group_by(cyl) %>%
virgulilla
dplyr::summarize(mean(mpg))

GRAFICAR: GRAFICAR: GRAFICAR:


una variable continua: una variable continua: una variable continua:
hist(mtcars$disp) lattice::histogram(~disp, data=mtcars) ggplot2::qplot(x=mpg, data=mtcars, geom="histogram")

boxplot(mtcars$disp) lattice::bwplot(~disp, data=mtcars) ggplot2::qplot(y=disp, x=1, data=mtcars, geom="boxplot")

una variable categórica: una variable categórica: una variable categórica:


barplot(table(mtcars$cyl)) mosaic::bargraph(~cyl, data=mtcars) ggplot2::qplot(x=cyl, data=mtcars, geom="bar")

dos variables continuas: dos variables continuas: dos variables continuas:


plot(mtcars$disp, mtcars$mpg) lattice::xyplot(mpg~disp, data=mtcars) ggplot2::qplot(x=disp, y=mpg, data=mtcars, geom="point")

dos variables categóricas: dos variables categóricas: dos variables categóricas:


mosaicplot(table(mtcars$am, mtcars$cyl)) mosaic::bargraph(~am, data=mtcars, group=cyl) ggplot2::qplot(x=factor(cyl), data=mtcars, geom="bar") +
facet_grid(.~am)
una continua, una categórica: una continua, una categórica:
histogram(mtcars$disp[mtcars$cyl==4]) lattice::histogram(~disp|cyl, data=mtcars) una continua, una categórica:
histogram(mtcars$disp[mtcars$cyl==6]) ggplot2::qplot(x=disp, data=mtcars, geom="histogram") +
histogram(mtcars$disp[mtcars$cyl==8]) lattice::bwplot(cyl~disp, data=mtcars) facet_grid(.~cyl)

boxplot(mtcars$disp[mtcars$cyl==4]) ggplot2::qplot(y=disp, x=factor(cyl), data=mtcars,


boxplot(mtcars$disp[mtcars$cyl==6]) geom="boxplot")
boxplot(mtcars$disp[mtcars$cyl==8]) La variedad de sintaxis de
MANEJO DE DATOS: R te permite “decir” lo MANEJO DE DATOS:
crear subconjuntos:
mtcars[mtcars$mpg>30, ]
mismo de diferentes modos crear subconjuntos:
mtcars %>% dplyr::filter(mpg>30)

crear una nueva variable: crear una nueva variable:


lee a lo ancho de esta hoja para ver cómo las
mtcars$efficient[mtcars$mpg>30] <- TRUE mtcars <- mtcars %>%
diferentes sintaxis se aproximan al mismo problema
mtcars$efficient[mtcars$mpg<30] <- FALSE dplyr::mutate(efficient = if_else(mpg>30, TRUE, FALSE))

RStudio® is a trademark of RStudio, PBC • CC BY Amelia McNamara • amcnamara@[Link] • @AmeliaMN • [Link]/~amcnamara/ • Updated: 2018-01
Comparación de sintaxis de R : : HOJA DE REFERENCIA
La sintaxis es el conjunto de reglas que definen qué
código funciona y qué código no funciona en un lenguaje de
Aun más formas de decir lo mismo
programación. Si bien la mayoría de los lenguajes de Incluso dentro de una misma sintaxis suelen haber variaciones que son igualmente válidas. Como caso de
programación ofrecen una sola sintaxis estandarizada, R permite estudio, miremos la sintaxis de ggplot2. ggplot2 es el paquete para graficar incluido en el Tidyverse. Si
a sus desarrolladores especificar la suya propia. Como resultado, lees esta columna hacia abajo, todo el código produce el mismo gráfico.
existe una gran variedad de sintaxis en R (igualmente válidas).
Las tres sintaxis de R más predominantes son: quickplot
1. La sintaxis de signo peso, a veces llamada
qplot() hace referencia a quickplot, y te permite hacer gráficos rápidos. No tiene todo el poder de

lee hacia abajo esta columna para ver bloques de código en una
sintaxis de R base, es la esperada por la

sintaxis que parece diferente, pero produce el mismo gráfico


mayoría de las funciones de R base. Se caracteriza por el ggplot2 y usa una sintaxis levemente diferente al resto del paquete.
uso de dataset$nombrevariable y se asocia a la
creación de subconjuntos con corchetes, como en ggplot2::qplot(x=disp, y=mpg, data=mtcars, geom="point")
dataset[1,2]. Casi todas las funciones de R aceptarán
elementos que se entreguen con esta sintaxis.
2. La sintaxis de fórmula, es la usada para ggplot2::qplot(x=disp, y=mpg, data=mtcars)
funciones de modelado como lm(), gráficos de lattice
y estadísticos de resumen de mosaic. Usa una virgulilla
(~) para conectar una variable de respuesta y uno (o ggplot2::qplot(disp, mpg, data=mtcars)
más) predictores. Muchas funciones de R base aceptan
este tipo de sintaxis.
3. La sintaxis del Tidyverse es la usada por
dplyr, tidyr y muchos otros paquetes. Estas funciones
esperan que los datos sean el primer argumento, lo que ggplot
permite trabajar con el “pipe” (%>%) del paquete
magrittr. Aunque ggplot2 se considera parte del Para liberar todo el poder de ggplot2, necesitas usar la función ggplot() (que prepara una región para
Tidyverse, tiene su propia variedad de sintaxis, que usa graficar) y agregar geoms (parámetros geométricos) al gráfico.
signos de suma (+) para encadenar las distintas partes
del código. Hadley Wickham, autor de ggplot2, ha dicho
que el paquete tendría una sintaxis distinta si lo hubiera ggplot2::ggplot(mtcars) +
desarrollado después de conocer el pipe. geom_point(aes(x=disp, y=mpg))
Si bien usualmente se intenta enseñar R en el marco de un tipo de sintaxis,
la mayoría de las personas programa usando una combinación de ellas.
ggplot2::ggplot(data=mtcars) + el ‘+’ agrega
geom_point(mapping=aes(x=disp, y=mpg)) capas

Tips para buscar en la web: ggplot2::ggplot(mtcars, aes(x=disp, y=mpg)) +


geom_point()
Si al buscar en Google, StackOverflow u otro recurso en
línea de tu preferencia te encuentras con código escrito
en una sintaxis que no reconoces: ggplot2::ggplot(mtcars, aes(x=disp)) +
• chequea si el código utiliza alguna de las tres sintaxis geom_point(aes(y=mpg))
comunes listadas en esta hoja de referencia.
• intenta buscar de nuevo agregando alguna palabra
clave del nombre de la sintaxis (“tidyverse”) o de un
ggformula
paquete relevante (“mosaic”). La “tercera forma y media” es usar la sintaxis de fórmula, pero para obtener gráficos tipo ggplot2

ggformula::gf_point(mpg~disp, data= mtcars)

Hay ocasiones en que una determinada sintaxis puede fórmulas en gráficos de R base
funcionar, pero se considera peligroso su uso porque es muy Los gráficos de R base también aceptan la sintaxis de fórmula, aunque no es un uso habitual
fácil producir errores. Por ejemplo, pasar nombres de variables
sin asignarlas a un argumento con nombre. plot(mpg~disp, data=mtcars)

RStudio® is a trademark of RStudio, PBC • CC BY Amelia McNamara • amcnamara@[Link] • @AmeliaMN • [Link]/~amcnamara/ • Updated: 2018-01

También podría gustarte