100% encontró este documento útil (1 voto)
141 vistas21 páginas

02.R Programming DataFrames PDF

Este documento presenta una introducción a los data frames en R. Explica que un data frame es una tabla de doble entrada que contiene variables en las columnas y observaciones en las filas. Detalla los tipos de datos que pueden almacenarse, incluyendo factores y vectores. Además, describe funciones para importar, exportar, crear, modificar, añadir filas/columnas y seleccionar partes de los data frames. Finalmente, proporciona enlaces a recursos adicionales sobre el uso de data frames en R.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
141 vistas21 páginas

02.R Programming DataFrames PDF

Este documento presenta una introducción a los data frames en R. Explica que un data frame es una tabla de doble entrada que contiene variables en las columnas y observaciones en las filas. Detalla los tipos de datos que pueden almacenarse, incluyendo factores y vectores. Además, describe funciones para importar, exportar, crear, modificar, añadir filas/columnas y seleccionar partes de los data frames. Finalmente, proporciona enlaces a recursos adicionales sobre el uso de data frames en R.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Curso Especializado

R Platform for Data Science A-Z


Breyson Meza
Contenidos
I. Programming Fundamentals
II. DataFrames
1. Introducción al DF
2. Importación de Datos
Introducción al DataFrame
Concepto, Composición y Tipos de datos
Que es un Data Frame
Es una tabla de doble entrada, formada por variables en las columnas y observaciones de estas columnas en las
filas. De manera que una fila contiene los valores de las variables para un mismo caso u observación.

• Tiene apariencia de una


matriz pero puede
contener distintos tipos
de datos, siempre en
cuando cada columna
tenga un solo tipo.
Data Frames: Composición
• Las columnas pueden ser vectores o factores.
• Las filas son list
Data Frames: Tipo de Datos

1. Tipo Atributo o cualitativo: Son los expresan una característica o cualidad del individuo. En R los
guardaremos en factores. Los tendremos de dos tipos:
• Los nominales: donde no importa el orden (Ejemplo: Pais, Sexo, etc.)
• Los ordinales: donde si importa el orden (Ejemplo: Rango de sueldo, Nivel socio económico, etc.)
2. Tipo cuantitativo: son datos numerales que se refieren a medidas. En R los guardaremos en vectores
numéricos. Ejemplo Sueldo, Peso, Longitud, Saldo de préstamo, etc.

Los tipos cuantitativos dependiendo de su comportamiento podrían se tratadas como Atributos luego de un
proceso de discretización.
Data Frame: Explorando una tabla de datos
• R trae consigo una tabla de datos incluida en el Data Frame llamado iris.
• Contiene la longitud y anchura de los pétalos y sépalo, así como la especie de 150 flores iris.

library(help = “datasets”)
First some information about the dataset.

• The dim() function tells the dimension


of the dataset
• The summary tells us something about
structure
• str() function gives is more information
Data Frames: Estructura de Datos

Funciones referidas a la estructura interna:


1. view: muestra los datos en la parte superior izquierda del Rstudio
2. head: muestra las primeras 6 filas del DataFrame
3. tail: muestra las 6 ultimas filas del DataFrame
4. str: da la estructura global de un objeto de datos
5. names: para obtener un vector con los nombres de las columnas
Permiten
6. rownames: para obtener un vector con los identificadores de las filas
modificar los
7. dimnames: para obtener una lista formada por el vector de los identificadores valores
obtenidos
de las filas y el vector de los nombres de las columnas de un dataframe.
8. dim: para obtener un vector con el numero de filas y columnas.
Manipulación de un Data Frame
Import, Export, Creación, Modificación
Importación
Importación: la Función Read Table

read.table() permite definir un data frame a partir de una tala de datos contenida en un fichero de
texto simple externo.
read.table(“ubicación del fichero de texto”)
Algunos parámetros:
• sep: para especificar la sepración entre columnas del fichero, por defecto son espacios en
blanco (tabs \t). Otros ejemplos: sep=“,” , sep=“;”, sep=“ ”, etc.
• header: si la tabla que importamos tiene una primera fila con los nombres de las columnas
hay que especificar que header=TRUE.
Es recomendable definir un espacio de trabajo para facilitar la importación de files.
Exportación: la función write table

write.table() permite exportar un data frame a un fichero externo.


write.table(“nombre del fichero de texto”)
Algunos parámetros:
• sep: para especificar la sepración entre columnas del fichero, por defecto son espacios en
blanco (tabs \t). Otros ejemplos: sep=“,” , sep=“;”, sep=“ ”, etc.
• dec: para indicar el separador decimal.
Es recomendable definir un espacio de trabajo para facilitar la importación de files.
Creación de Data Frames

Utilizaremos la función data.frame() aplicada a los vectores que serán las columnas.
df=data.frame(c(….))
Algunos parámetros:
• row.names: para especificar los identificadores de las filas.
• stringAsFactor: con stringAsFactor=FLASE, imponemos que los vectores de palabras se
mantengan como tales en el data frame, por defecto se crean factores.
Modificar un Data Frames

1. Cambiar todos los nombres de las columnas:


• names(data frame) = vector con los nuevos nombres de las columnas.
2. Modificar los identificadores de las filas:
• rownames(data frame) = vector con los nombres de las filas.
3. Modificar los nombres de las filas y las columnas simultaneamente:
• dimnames(data frame) = list(vector con los nombres de las filas , vector con los nuevos
nombres de las columnas).
4. Modificar una columna entera:
• data frame$variable = nuevo valor.
5. Cambiar tipo de columna
• as.factor(), as.carácter, as.integer, as.numeric
Añadir filas y columnas a un Data Frames

➢ Añadir filas:
1. Crear un nuevo data frame con los mismos nombres de las variables
2. Concatenar las filas usando rbind.
➢ Añadir columnas:
• Especificar el valor de la columna:
data frame$Nueva=vector/factor de nuevos valores
o
• Usando la función rbind. a una variable con la misma longitud de variables que el data
frame.
Consulta a un Data Frame
Selección y Filtros
Selección y Filtros

No siempre se utilizan todas las variables No siempre se utilizan todas las observaciones
Seleccionando trozos de un data frame
La función select
La función subset
Recursos R:

https://www.youtube.com/watch?v=S9u8JGJr2OY
http://www.ugr.es/~javierrp/master_files/Tutorial%20de%20R.pdf
https://www.rstudio.com/resources/cheatsheets/

También podría gustarte