Jak exportovat data z R do CSV, Excel
Jak exportovat data z R
V tomto tutoriálu se naučíme exportovat data z prostředí R do různých formátů.
Chcete-li exportovat data na pevný disk, potřebujete cestu k souboru a příponu. Za prvé, cesta je místo, kde budou data uložena. V tomto tutoriálu uvidíte, jak ukládat data na:
- Pevný disk
- Google Drive
- Dropbox
Za druhé, R umožňuje uživatelům exportovat data do různých typů souborů. Pokrýváme základní příponu souboru:
- csv
- XLSX
- RDS
- SAS
- SPSS
- STATISTA
Celkově vzato není těžké exportovat data z R.
Export na pevný disk
Pro začátek můžete data uložit přímo do pracovního adresáře. Následující kód vypíše cestu k vašemu pracovnímu adresáři:
directory <-getwd() directory
Výstup:
## [1] "/Users/15_Export_to_do"
Ve výchozím nastavení bude soubor uložen do níže uvedené cesty.
Pro Mac OS:
/Users/USERNAME/Downloads/
Pro Windows:
C:\Users\USERNAME\Documents\
Můžete samozřejmě nastavit jinou cestu. Můžete například změnit cestu ke složce pro stahování.
Vytvořte datový rámec
Nejprve importujme datovou sadu mtcars a získáme průměr mpg a disp seskupených podle zařízení.
library(dplyr)
df <-mtcars % > %
select(mpg, disp, gear) % > %
group_by(gear) % > %
summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df
Výstup:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
Tabulka obsahuje tři řádky a tři sloupce. Soubor CSV můžete vytvořit pomocí funkce write.csv v R.
Jak exportovat DataFrame do souboru CSV v R
Základní syntaxe write.csv v R pro export DataFrame do CSV v R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Příklad:
write.csv(df, "table_car.csv")
Vysvětlení kódu
- write.csv(df, “table_car.csv”): Vytvořte soubor CSV na pevném disku:
- df: název datového rámce v prostředí
- „table_car.csv“: Pojmenujte soubor table_car a uložte jej jako csv
Hodnocení: Můžete použít funkci write.csv v R jako write.csv2() k oddělení řádků středníkem pro export R do dat csv.
write.csv2(df, "table_car.csv")
Hodnocení: Pouze pro pedagogické účely jsme vytvořili funkci nazvanou open_folder(), která vám otevře složku adresáře. Stačí spustit níže uvedený kód a podívat se, kde je uložen soubor csv. Měli byste vidět názvy souborů table_car.csv pro export dat R do csv.
# Run this code to create the function
open_folder <-function(dir){
if (.Platform['OS.type'] == "windows"){
shell.exec(dir)
} else {
system(paste(Sys.getenv("R_BROWSER"), dir))
}
}
# Call the function to open the folder
open_folder(directory)
Jak exportovat data z R do souboru Excel
Nyní se naučíme, jak exportovat data z R do Excelu:
Export dat z R do Excelu je triviální Windows uživatelů a složitější pro uživatele Mac OS. Oba uživatelé použijí knihovnu xlsx k vytvoření souboru Excel. Drobný rozdíl pochází z instalace knihovny. Knihovna xlsx skutečně používá Java k vytvoření souboru. Java pro export dat R do Excelu je třeba nainstalovat, pokud není ve vašem počítači přítomen.
Windows uživatelé
Pokud jste Windows uživatel, můžete nainstalovat knihovnu přímo s conda pro export datového rámce do Excel R:
conda install -c r r-xlsx
Jakmile je knihovna nainstalována, můžete použít funkci write.xlsx(). V pracovním adresáři se vytvoří nový excelový sešit pro export R do dat Excelu
library(xlsx) write.xlsx(df, "table_car.xlsx")
Pokud jste uživatelem Mac OS, musíte postupovat takto:
- Krok 1: Nainstalujte nejnovější verzi Java
- Krok 2: Nainstalujte knihovnu rJava
- Krok 3: Nainstalujte knihovnu xlsx
Krok 1) Mohl bys stáhnout Java od úředníka Oracle web a nainstalujte jej.
Můžete se vrátit do Rstudia a zkontrolovat, kterou verzi Java je nainstalován.
system("java -version")
V době výukového programu byla nejnovější verze Java je 9.0.4.
Krok 2) Musíte nainstalovat rjavu v R. Doporučujeme vám nainstalovat R a Rstudio s Anacondou. Anaconda spravuje závislosti mezi knihovnami. V tomto smyslu Anaconda zvládne složitosti z rJava instalace.
Nejprve musíte aktualizovat conda a poté nainstalovat knihovna. Další dva řádky kódu můžete zkopírovat a vložit do terminálu.
conda - conda update conda install -c r r-rjava
Dále otevřete rjavu v Rstudiu
library(rJava)
Krok 3) Konečně je čas nainstalovat xlsx. Opět můžete použít Conda udělat to:
conda install -c r r-xlsx
Stejně jako uživatelé systému Windows můžete ukládat data pomocí funkce write.xlsx()
library(xlsx)
Výstup:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Export dat z R do jiného softwaru
Export dat do jiného softwaru je stejně jednoduchý jako jejich import. Knihovna „útočiště“ poskytuje pohodlný způsob exportu dat do
- spss
- sas
- stata
Nejprve naimportujte knihovnu. Pokud nemáte „útočiště“, můžete jít zde nainstalovat.
library(haven)
soubor SPSS
Níže je uveden kód pro export dat do softwaru SPSS:
write_sav(df, "table_car.sav")
Export dat z R do SAS souboru
Stejně jednoduše jako spss můžete exportovat do sas
write_sas(df, "table_car.sas7bdat")
Jak exportovat data z R do souboru STATA
Knihovna Haven konečně umožňuje zápis souboru .dta.
write_dta(df, "table_car.dta")
R
Pokud chcete uložit datový rámec nebo jakýkoli jiný objekt R, můžete použít funkci save().
save(df, file ='table_car.RData')
Soubory vytvořené výše můžete zkontrolovat v aktuálním pracovním adresáři
Interakce s cloudovými službami
V neposlední řadě, R je vybaven fantastickými knihovnami pro interakci se službami cloud computingu. Poslední část tohoto tutoriálu se zabývá exportem/importem souborů z:
- Google Drive
- Dropbox
Hodnocení: Tato část výukového programu předpokládá, že máte účet u Google a Dropbox. Pokud ne, můžete jej rychle vytvořit pro – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
Abyste získali přístup k funkci umožňující interakci, musíte si nainstalovat knihovnu googledrive Google Drive.
Knihovna zatím není v Anacondě k dispozici. Můžete jej nainstalovat pomocí kódu níže v konzole.
install.packages("googledrive")
a otevřete knihovnu.
library(googledrive)
Pro uživatele bez conda je instalace knihovny snadná, můžete použít funkci install.packages('NAME OF PACKAGE) s názvem balíčku v závorce. Nezapomeňte na „ “. Všimněte si, že R má balíček nainstalovat do `libPaths() automaticky. Stojí za to to vidět v akci.
Nahrát do Google Drive
Chcete-li nahrát soubor na disk Google, musíte použít funkci drive_upload().
Pokaždé, když restartujete Rstudio, budete vyzváni k povolení přístupu k tidyverse Google Drive.
Základní syntaxe drive_upload() je
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Po spuštění kódu musíte potvrdit několik otázek
drive_upload%<("table_car.csv", name ="table_car")
Výstup:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Zadáním 1 do konzoly potvrďte přístup
Poté budete přesměrováni na Google API, abyste povolili přístup. Klikněte na Povolit.
Po dokončení ověřování můžete prohlížeč ukončit.
Na konzole Rstudia můžete vidět shrnutí provedeného kroku. Google úspěšně nahrál soubor umístěný místně na Disku. Google každému souboru na disku přidělil ID.
Tento soubor můžete vidět v Google Spreadsheet.
drive_browse("table_car")
Výstup:
Budete přesměrováni na Google Spreadsheet
Importovat z Google Drive
Nahrajte soubor z Google Drive s ID je pohodlné. Pokud znáte název souboru, můžete získat jeho ID takto:
Hodnocení: V závislosti na vašem internetovém připojení a velikosti vašeho Disku to chvíli trvá.
x <-drive_get("table_car")
as_id(x)
ID jste uložili do proměnné x. Funkce drive_download() umožňuje stahování souboru z Google Drive.
Základní syntaxe je:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Konečně si můžete stáhnout soubor:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Vysvětlení kódu
- drive_download(): Funkce pro stažení souboru Google Drive
- as_id(x): Použijte ID k procházení souboru Google Drive
- overwrite = TRUE: Pokud soubor existuje, přepište jej, jinak se provádění zastaví Chcete-li zobrazit název souboru lokálně, můžete použít:
Výstup:
Soubor je uložen ve vašem pracovním adresáři. Nezapomeňte, že pro otevření souboru v R musíte přidat příponu souboru. Úplný název můžete vytvořit pomocí funkce paste() (tj. table_car.csv)
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
Výstup:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Nakonec můžete soubor odstranit z disku Google.
## remove file
drive_find("table_car") %>%drive_rm()
Výstup:
Je to pomalý proces. Smazání trvá dlouho
Exportovat do Dropbox
R interaguje s Dropbox prostřednictvím knihovny rdrop2. Knihovna není k dispozici ani v Anacondě. Můžete jej nainstalovat přes konzolu
install.packages('rdrop2')
library(rdrop2)
Musíte poskytnout dočasný přístup k Dropbox s vaším pověřením. Po provedení identifikace může R vytvořit, odebrat upload a stáhnout do vašeho Dropbox.
Nejprve musíte udělit přístup ke svému účtu. Pověření se ukládají do mezipaměti během celé relace.
drop_auth()
Budete přesměrováni na Dropbox pro potvrzení ověření.
Zobrazí se potvrzovací stránka. Můžete jej zavřít a vrátit se do R
Složku můžete vytvořit pomocí funkce drop_create().
- drop_create('my_first_drop'): Vytvořte složku v první větvi Dropbox
- drop_create('First_branch/my_first_drop'): Vytvořte složku v existující složce First_branch.
drop_create('my_first_drop')
Výstup:
In DropBox
Chcete-li nahrát soubor .csv do svého Dropbox, použijte funkci drop_upload().
Základní syntaxe:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Výstup:
U DropBox
Můžete číst soubor csv z Dropbox pomocí funkce drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car
Výstup:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Když skončíte s používáním souboru a chcete jej smazat. Musíte napsat cestu k souboru ve funkci drop_delete()
drop_delete('my_first_drop/table_car.csv')
Výstup:
Je také možné smazat složku
drop_delete('my_first_drop')
Výstup:
Shrnutí
Všechny funkce můžeme shrnout v tabulce níže
| Knihovna | Objektivní | funkce |
|---|---|---|
| základna | Export csv | write.csv() |
| XLSX | Exportovat excel | write.xlsx() |
| útočiště | Export spss | write_sav() |
| útočiště | Export sas | write_sas() |
| útočiště | Exportovat statistiky | write_dta() |
| základna | Export R | Uložit() |
| googledrive | Nahrát Google Drive | drive_upload() |
| googledrive | Otevřít v Google Drive | drive_browse() |
| googledrive | Načíst ID souboru | drive_get(as_id()) |
| googledrive | Stáhnout z Google Drive | download_google() |
| googledrive | Odebrat soubor z Google Drive | drive_rm() |
| rdrop2 | ověření pravosti | drop_auth() |
| rdrop2 | Vytvořte složku | drop_create() |
| rdrop2 | Nahrát do Dropbox | drop_upload() |
| rdrop2 | Přečíst csv z Dropbox | drop_read_csv |
| rdrop2 | Smazat soubor z Dropbox | drop_delete() |













