Jak exportovat data z R do CSV, Excel

Jak exportovat data z R

V tomto tutoriálu se naučíme exportovat data z prostředí R do různých formátů.

Chcete-li exportovat data na pevný disk, potřebujete cestu k souboru a příponu. Za prvé, cesta je místo, kde budou data uložena. V tomto tutoriálu uvidíte, jak ukládat data na:

  • Pevný disk
  • Google Drive
  • Dropbox

Za druhé, R umožňuje uživatelům exportovat data do různých typů souborů. Pokrýváme základní příponu souboru:

  • csv
  • XLSX
  • RDS
  • SAS
  • SPSS
  • STATISTA

Celkově vzato není těžké exportovat data z R.

Export na pevný disk

Pro začátek můžete data uložit přímo do pracovního adresáře. Následující kód vypíše cestu k vašemu pracovnímu adresáři:

directory <-getwd()
directory

Výstup:

## [1] "/Users/15_Export_to_do"

Ve výchozím nastavení bude soubor uložen do níže uvedené cesty.

Pro Mac OS:

/Users/USERNAME/Downloads/

Pro Windows:

C:\Users\USERNAME\Documents\

Můžete samozřejmě nastavit jinou cestu. Můžete například změnit cestu ke složce pro stahování.

Vytvořte datový rámec

Nejprve importujme datovou sadu mtcars a získáme průměr mpg a disp seskupených podle zařízení.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Výstup:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Tabulka obsahuje tři řádky a tři sloupce. Soubor CSV můžete vytvořit pomocí funkce write.csv v R.

Jak exportovat DataFrame do souboru CSV v R

Základní syntaxe write.csv v R pro export DataFrame do CSV v R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Příklad:

write.csv(df, "table_car.csv")

Vysvětlení kódu

  • write.csv(df, “table_car.csv”): Vytvořte soubor CSV na pevném disku:
    • df: název datového rámce v prostředí
    • „table_car.csv“: Pojmenujte soubor table_car a uložte jej jako csv

Hodnocení: Můžete použít funkci write.csv v R jako write.csv2() k oddělení řádků středníkem pro export R do dat csv.

write.csv2(df, "table_car.csv")

Hodnocení: Pouze pro pedagogické účely jsme vytvořili funkci nazvanou open_folder(), která vám otevře složku adresáře. Stačí spustit níže uvedený kód a podívat se, kde je uložen soubor csv. Měli byste vidět názvy souborů table_car.csv pro export dat R do csv.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Jak exportovat data z R do souboru Excel

Nyní se naučíme, jak exportovat data z R do Excelu:

Export dat z R do Excelu je triviální Windows uživatelů a složitější pro uživatele Mac OS. Oba uživatelé použijí knihovnu xlsx k vytvoření souboru Excel. Drobný rozdíl pochází z instalace knihovny. Knihovna xlsx skutečně používá Java k vytvoření souboru. Java pro export dat R do Excelu je třeba nainstalovat, pokud není ve vašem počítači přítomen.

Windows uživatelé

Pokud jste Windows uživatel, můžete nainstalovat knihovnu přímo s conda pro export datového rámce do Excel R:

conda install -c r r-xlsx

Jakmile je knihovna nainstalována, můžete použít funkci write.xlsx(). V pracovním adresáři se vytvoří nový excelový sešit pro export R do dat Excelu

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Pokud jste uživatelem Mac OS, musíte postupovat takto:

  • Krok 1: Nainstalujte nejnovější verzi Java
  • Krok 2: Nainstalujte knihovnu rJava
  • Krok 3: Nainstalujte knihovnu xlsx

Krok 1) Mohl bys stáhnout Java od úředníka Oracle web a nainstalujte jej.

Můžete se vrátit do Rstudia a zkontrolovat, kterou verzi Java je nainstalován.

system("java -version")

V době výukového programu byla nejnovější verze Java je 9.0.4.

Krok 2) Musíte nainstalovat rjavu v R. Doporučujeme vám nainstalovat R a Rstudio s Anacondou. Anaconda spravuje závislosti mezi knihovnami. V tomto smyslu Anaconda zvládne složitosti z rJava instalace.

Nejprve musíte aktualizovat conda a poté nainstalovat knihovna. Další dva řádky kódu můžete zkopírovat a vložit do terminálu.

conda - conda update
conda install -c r r-rjava

Dále otevřete rjavu v Rstudiu

library(rJava)

Krok 3) Konečně je čas nainstalovat xlsx. Opět můžete použít Conda udělat to:

conda install -c r r-xlsx

Stejně jako uživatelé systému Windows můžete ukládat data pomocí funkce write.xlsx()

library(xlsx)

Výstup:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Export dat z R do jiného softwaru

Export dat do jiného softwaru je stejně jednoduchý jako jejich import. Knihovna „útočiště“ poskytuje pohodlný způsob exportu dat do

  • spss
  • sas
  • stata

Nejprve naimportujte knihovnu. Pokud nemáte „útočiště“, můžete jít zde nainstalovat.

library(haven)

soubor SPSS

Níže je uveden kód pro export dat do softwaru SPSS:

write_sav(df, "table_car.sav")

Export dat z R do SAS souboru

Stejně jednoduše jako spss můžete exportovat do sas

write_sas(df, "table_car.sas7bdat")

Jak exportovat data z R do souboru STATA

Knihovna Haven konečně umožňuje zápis souboru .dta.

write_dta(df, "table_car.dta")

R

Pokud chcete uložit datový rámec nebo jakýkoli jiný objekt R, můžete použít funkci save().

save(df, file ='table_car.RData')

Soubory vytvořené výše můžete zkontrolovat v aktuálním pracovním adresáři

Export dat z R do souboru STATA

Interakce s cloudovými službami

V neposlední řadě, R je vybaven fantastickými knihovnami pro interakci se službami cloud computingu. Poslední část tohoto tutoriálu se zabývá exportem/importem souborů z:

  • Google Drive
  • Dropbox

Hodnocení: Tato část výukového programu předpokládá, že máte účet u Google a Dropbox. Pokud ne, můžete jej rychle vytvořit pro – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Abyste získali přístup k funkci umožňující interakci, musíte si nainstalovat knihovnu googledrive Google Drive.

Knihovna zatím není v Anacondě k dispozici. Můžete jej nainstalovat pomocí kódu níže v konzole.

install.packages("googledrive")

a otevřete knihovnu.

library(googledrive)

Pro uživatele bez conda je instalace knihovny snadná, můžete použít funkci install.packages('NAME OF PACKAGE) s názvem balíčku v závorce. Nezapomeňte na „ “. Všimněte si, že R má balíček nainstalovat do `libPaths() automaticky. Stojí za to to vidět v akci.

Nahrát do Google Drive

Chcete-li nahrát soubor na disk Google, musíte použít funkci drive_upload().

Pokaždé, když restartujete Rstudio, budete vyzváni k povolení přístupu k tidyverse Google Drive.

Základní syntaxe drive_upload() je

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Po spuštění kódu musíte potvrdit několik otázek

drive_upload%<("table_car.csv", name ="table_car")

Výstup:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Zadáním 1 do konzoly potvrďte přístup

Google Drive

Poté budete přesměrováni na Google API, abyste povolili přístup. Klikněte na Povolit.

Google Drive

Po dokončení ověřování můžete prohlížeč ukončit.

Google Drive

Na konzole Rstudia můžete vidět shrnutí provedeného kroku. Google úspěšně nahrál soubor umístěný místně na Disku. Google každému souboru na disku přidělil ID.

Google Drive

Tento soubor můžete vidět v Google Spreadsheet.

drive_browse("table_car")

Výstup:

Budete přesměrováni na Google Spreadsheet

Google Drive

Importovat z Google Drive

Nahrajte soubor z Google Drive s ID je pohodlné. Pokud znáte název souboru, můžete získat jeho ID takto:

Hodnocení: V závislosti na vašem internetovém připojení a velikosti vašeho Disku to chvíli trvá.

x <-drive_get("table_car")
as_id(x)

Google Drive

ID jste uložili do proměnné x. Funkce drive_download() umožňuje stahování souboru z Google Drive.

Základní syntaxe je:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Konečně si můžete stáhnout soubor:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Vysvětlení kódu

  • drive_download(): Funkce pro stažení souboru Google Drive
  • as_id(x): Použijte ID k procházení souboru Google Drive
  • overwrite = TRUE: Pokud soubor existuje, přepište jej, jinak se provádění zastaví Chcete-li zobrazit název souboru lokálně, můžete použít:

Výstup:

Google Drive

Soubor je uložen ve vašem pracovním adresáři. Nezapomeňte, že pro otevření souboru v R musíte přidat příponu souboru. Úplný název můžete vytvořit pomocí funkce paste() (tj. table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Výstup:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Nakonec můžete soubor odstranit z disku Google.

## remove file
drive_find("table_car") %>%drive_rm()

Výstup:

Google Drive

Je to pomalý proces. Smazání trvá dlouho

Exportovat do Dropbox

R interaguje s Dropbox prostřednictvím knihovny rdrop2. Knihovna není k dispozici ani v Anacondě. Můžete jej nainstalovat přes konzolu

install.packages('rdrop2')
library(rdrop2)

Musíte poskytnout dočasný přístup k Dropbox s vaším pověřením. Po provedení identifikace může R vytvořit, odebrat upload a stáhnout do vašeho Dropbox.

Nejprve musíte udělit přístup ke svému účtu. Pověření se ukládají do mezipaměti během celé relace.

drop_auth()

Budete přesměrováni na Dropbox pro potvrzení ověření.

Exportovat do Dropbox

Zobrazí se potvrzovací stránka. Můžete jej zavřít a vrátit se do R

Exportovat do Dropbox

Složku můžete vytvořit pomocí funkce drop_create().

  • drop_create('my_first_drop'): Vytvořte složku v první větvi Dropbox
  • drop_create('First_branch/my_first_drop'): Vytvořte složku v existující složce First_branch.
drop_create('my_first_drop')

Výstup:

Exportovat do Dropbox

In DropBox

Exportovat do Dropbox

Chcete-li nahrát soubor .csv do svého Dropbox, použijte funkci drop_upload().

Základní syntaxe:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Výstup:

Exportovat do Dropbox

U DropBox

Exportovat do Dropbox

Můžete číst soubor csv z Dropbox pomocí funkce drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Výstup:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Když skončíte s používáním souboru a chcete jej smazat. Musíte napsat cestu k souboru ve funkci drop_delete()

drop_delete('my_first_drop/table_car.csv')

Výstup:

Exportovat do Dropbox

Je také možné smazat složku

drop_delete('my_first_drop')

Výstup:

Exportovat do Dropbox

Shrnutí

Všechny funkce můžeme shrnout v tabulce níže

Knihovna Objektivní funkce
základna Export csv write.csv()
XLSX Exportovat excel write.xlsx()
útočiště Export spss write_sav()
útočiště Export sas write_sas()
útočiště Exportovat statistiky write_dta()
základna Export R Uložit()
googledrive Nahrát Google Drive drive_upload()
googledrive Otevřít v Google Drive drive_browse()
googledrive Načíst ID souboru drive_get(as_id())
googledrive Stáhnout z Google Drive download_google()
googledrive Odebrat soubor z Google Drive drive_rm()
rdrop2 ověření pravosti drop_auth()
rdrop2 Vytvořte složku drop_create()
rdrop2 Nahrát do Dropbox drop_upload()
rdrop2 Přečíst csv z Dropbox drop_read_csv
rdrop2 Smazat soubor z Dropbox drop_delete()

Shrňte tento příspěvek takto: