كيفية تصدير البيانات من R إلى CSV، Excel

كيفية تصدير البيانات من R

في هذا البرنامج التعليمي، سوف نتعلم كيفية تصدير البيانات من بيئة R إلى تنسيقات مختلفة.

لتصدير البيانات إلى القرص الصلب، تحتاج إلى مسار الملف وامتداده. أولاً، المسار هو الموقع الذي سيتم تخزين البيانات فيه. في هذا البرنامج التعليمي، ستشاهد كيفية تخزين البيانات على:

  • القرص الصلب
  • Google Drive
  • Dropbox

ثانيًا، يسمح R للمستخدمين بتصدير البيانات إلى أنواع مختلفة من الملفات. نحن نغطي امتداد الملف الأساسي:

  • CSV
  • XLSX
  • RDS
  • SAS
  • SPSS
  • ستاتا

بشكل عام، ليس من الصعب تصدير البيانات من R.

تصدير إلى القرص الصلب

للبدء، يمكنك حفظ البيانات مباشرةً في دليل العمل. يقوم الكود التالي بطباعة مسار دليل العمل الخاص بك:

directory <-getwd()
directory

الإخراج:

## [1] "/Users/15_Export_to_do"

بشكل افتراضي، سيتم حفظ الملف في المسار أدناه.

لنظام التشغيل Mac OS:

/Users/USERNAME/Downloads/

في حالة Windows:

C:\Users\USERNAME\Documents\

يمكنك بالطبع تحديد مسار مختلف. على سبيل المثال، يمكنك تغيير المسار إلى مجلد التنزيل.

إنشاء إطار البيانات

أولاً، لنستورد مجموعة بيانات mtcars ونحصل على متوسط ​​ميل لكل جالون وdisp مجمعين حسب العتاد.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

الإخراج:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

يحتوي الجدول على ثلاثة صفوف وثلاثة أعمدة. يمكنك إنشاء ملف CSV باستخدام الوظيفة write.csv في R.

كيفية تصدير DataFrame إلى ملف CSV في R

بناء الجملة الأساسي لـ write.csv في R لتصدير DataFrame إلى CSV في R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

على سبيل المثال:

write.csv(df, "table_car.csv")

شرح الكود

  • write.csv(df, “table_car.csv”): قم بإنشاء ملف CSV في القرص الصلب:
    • df: اسم إطار البيانات في البيئة
    • "table_car.csv": قم بتسمية الملف table_car وقم بتخزينه كملف csv

ملاحظات: يمكنك استخدام الدالة write.csv في R كـ write.csv2() لفصل الصفوف بفاصلة منقوطة لتصدير R إلى بيانات CSV.

write.csv2(df, "table_car.csv")

ملاحظات: للأغراض التعليمية فقط، أنشأنا وظيفة تسمى open_folder() لفتح مجلد الدليل لك. كل ما عليك فعله هو تشغيل الكود أدناه ومعرفة مكان تخزين ملف CSV. يجب أن تشاهد أسماء الملفات table_car.csv لتصدير البيانات R إلى ملف CSV.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

كيفية تصدير البيانات من R إلى ملف Excel

الآن، سوف نتعلم كيفية تصدير البيانات من R إلى Excel:

يعد تصدير البيانات من R إلى Excel أمرًا تافهًا Windows المستخدمين وأكثر صعوبة بالنسبة لمستخدم نظام التشغيل Mac OS. سيستخدم كلا المستخدمين مكتبة xlsx لإنشاء ملف Excel. يأتي الاختلاف الطفيف من تثبيت المكتبة. في الواقع، تستخدم مكتبة XLSX Java لإنشاء الملف. Java يجب تثبيته إذا لم يكن موجودًا في جهازك لتصدير Data R إلى Excel.

Windows المستخدمين

إذا كنت Windows أيها المستخدم، يمكنك تثبيت المكتبة مباشرةً باستخدام conda لتصدير إطار البيانات إلى Excel R:

conda install -c r r-xlsx

بمجرد تثبيت المكتبة، يمكنك استخدام الدالة write.xlsx(). يتم إنشاء مصنف Excel جديد في دليل العمل لتصدير R إلى بيانات Excel

library(xlsx)
write.xlsx(df, "table_car.xlsx")

إذا كنت من مستخدمي نظام التشغيل Mac OS، فأنت بحاجة إلى اتباع الخطوات التالية:

  • الخطوة 1: تثبيت أحدث إصدار من Java
  • الخطوة 2: تثبيت المكتبة rJava
  • الخطوة 3: تثبيت مكتبة xlsx

الخطوة 1) هل يمكن تحميل Java من مسؤول Oracle الموقع وتثبيته.

يمكنك العودة إلى Rstudio والتحقق من إصدار Java تم تثبيت.

system("java -version")

في وقت البرنامج التعليمي، أحدث إصدار من Java هو 9.0.4.

الخطوة 2) تحتاج إلى تثبيت rjava في R. نوصيك بتثبيت R وRstudio مع Anaconda. تدير Anaconda التبعيات بين المكتبات. بهذا المعنى، ستتعامل Anaconda مع تعقيدات rJava تركيب.

أولاً وقبل كل شيء، تحتاج إلى تحديث conda ثم تثبيت مكتبة. يمكنك نسخ ولصق السطرين التاليين من التعليمات البرمجية في الجهاز.

conda - conda update
conda install -c r r-rjava

بعد ذلك، افتح rjava في Rstudio

library(rJava)

الخطوة 3) وأخيرا، حان الوقت لتثبيت xlsx. مرة أخرى، يمكنك استخدام كوندا للقيام بذلك:

conda install -c r r-xlsx

تمامًا مثل مستخدمي Windows، يمكنك حفظ البيانات باستخدام الدالة write.xlsx()

library(xlsx)

الإخراج:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

تصدير البيانات من R إلى برامج مختلفة

إن تصدير البيانات إلى برامج مختلفة أمر بسيط مثل استيرادها. توفر المكتبة "haven" طريقة ملائمة لتصدير البيانات إلى

  • com.spss
  • ساس
  • كان

أولاً، قم باستيراد المكتبة. إذا لم يكن لديك "haven"، يمكنك الانتقال إلى هنا لتثبيته.

library(haven)

ملف SPSS

وفيما يلي الكود لتصدير البيانات إلى برنامج SPSS:

write_sav(df, "table_car.sav")

تصدير البيانات من R إلى ملف SAS

وببساطة spss، يمكنك التصدير إلى sas

write_sas(df, "table_car.sas7bdat")

كيفية تصدير البيانات من R إلى ملف STATA

وأخيرًا، تسمح مكتبة haven بكتابة ملف .dta.

write_dta(df, "table_car.dta")

R

إذا كنت تريد حفظ إطار بيانات أو أي كائن R آخر، فيمكنك استخدام وظيفة save().

save(df, file ='table_car.RData')

يمكنك التحقق من الملفات التي تم إنشاؤها أعلاه في دليل العمل الحالي

تصدير البيانات من R إلى ملف STATA

التفاعل مع الخدمات السحابية

وأخيرا وليس آخرا، R مجهز بمكتبات رائعة للتفاعل مع خدمات الحوسبة السحابية. يتناول الجزء الأخير من هذا البرنامج التعليمي ملفات التصدير/الاستيراد من:

  • Google Drive
  • Dropbox

ملاحظات: يفترض هذا الجزء من البرنامج التعليمي أن لديك حسابًا في Google و Dropbox. إذا لم يكن الأمر كذلك، فيمكنك إنشاء واحد بسرعة لـ – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

يجب عليك تثبيت مكتبة googledrive للوصول إلى الوظيفة التي تسمح بالتفاعل مع Google Drive.

المكتبة ليست متاحة بعد في أناكوندا. يمكنك تثبيته باستخدام الكود أدناه في وحدة التحكم.

install.packages("googledrive")

وقمت بفتح المكتبة.

library(googledrive)

بالنسبة للمستخدمين الذين لا يستخدمون conda، يعد تثبيت المكتبة أمرًا سهلاً، ويمكنك استخدام الوظيفة install.packages('NAME OF PACKAGE) مع اسم الحزمة داخل القوسين. لا تنسى ''. لاحظ أنه من المفترض أن يقوم R بتثبيت الحزمة في libPaths() تلقائيًا. ومن الجدير أن نرى ذلك في العمل.

حمل الى Google Drive

لتحميل ملف إلى Google Drive، يجب عليك استخدام الدالة drive_upload().

في كل مرة تقوم فيها بإعادة تشغيل Rstudio، سيُطلب منك السماح بالوصول إلى tidyverse Google Drive.

بناء الجملة الأساسي لـdrive_upload() هو

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

بعد تشغيل التعليمات البرمجية، تحتاج إلى تأكيد عدة أسئلة

drive_upload%<("table_car.csv", name ="table_car")

الإخراج:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

اكتب 1 في وحدة التحكم لتأكيد الوصول

Google Drive

وبعد ذلك، تتم إعادة توجيهك إلى Google API للسماح بالوصول. انقر فوق السماح.

Google Drive

بمجرد اكتمال المصادقة، يمكنك الخروج من المتصفح.

Google Drive

في وحدة تحكم Rstudio، يمكنك رؤية ملخص الخطوة المنجزة. نجحت Google في تحميل الملف الموجود محليًا على Drive. قامت Google بتعيين معرف لكل ملف في محرك الأقراص.

Google Drive

يمكنك رؤية هذا الملف في Google Spreadsheet.

drive_browse("table_car")

الإخراج:

سيتم توجيهك إلى Google Spreadsheet

Google Drive

الاستيراد من Google Drive

رفع ملف من Google Drive مع الهوية مريحة. إذا كنت تعرف اسم الملف، يمكنك الحصول على معرفه على النحو التالي:

ملاحظات: اعتمادًا على اتصالك بالإنترنت وحجم Drive الخاص بك، يستغرق الأمر بعض الوقت.

x <-drive_get("table_car")
as_id(x)

Google Drive

لقد قمت بتخزين المعرف في المتغير x. تسمح الدالة drive_download() بتنزيل ملف من Google Drive.

بناء الجملة الأساسي هو:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

يمكنك أخيرًا تنزيل الملف:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

شرح الكود

  • Drive_download(): وظيفة تنزيل ملف من Google Drive
  • as_id(x): استخدم المعرف لتصفح الملف فيه Google Drive
  • الكتابة فوق = TRUE: في حالة وجود الملف، قم بالكتابة فوقه، وإلا سيتم إيقاف التنفيذ لرؤية اسم الملف محليًا، يمكنك استخدام:

الإخراج:

Google Drive

يتم تخزين الملف في دليل العمل الخاص بك. تذكر أنك تحتاج إلى إضافة امتداد الملف لفتحه في R. يمكنك إنشاء الاسم الكامل باستخدام الدالة لصق () (على سبيل المثال، table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

الإخراج:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

وأخيرًا، يمكنك إزالة الملف من Google Drive.

## remove file
drive_find("table_car") %>%drive_rm()

الإخراج:

Google Drive

إنها عملية بطيئة. يستغرق وقتا للحذف

تصدير الى Dropbox

يتفاعل مع R Dropbox عبر مكتبة rdrop2. المكتبة غير متوفرة في أناكوندا أيضًا. يمكنك تثبيته عبر وحدة التحكم

install.packages('rdrop2')
library(rdrop2)

تحتاج إلى توفير الوصول المؤقت إلى Dropbox مع بيانات الاعتماد الخاصة بك. بعد الانتهاء من التعريف، يمكن لـ R إنشاء وإزالة التحميل والتنزيل على جهازك Dropbox.

بادئ ذي بدء، تحتاج إلى منح حق الوصول إلى حسابك. يتم تخزين بيانات الاعتماد مؤقتًا أثناء الجلسة بأكملها.

drop_auth()

سيتم توجيهك إلى Dropbox لتأكيد المصادقة.

تصدير الى Dropbox

سوف تحصل على صفحة التأكيد. يمكنك إغلاقه والعودة إلى R

تصدير الى Dropbox

يمكنك إنشاء مجلد باستخدام الوظيفة drop_create().

  • drop_create('my_first_drop'): قم بإنشاء مجلد في الفرع الأول من Dropbox
  • drop_create('First_branch/my_first_drop'): قم بإنشاء مجلد داخل مجلد First_branch الموجود.
drop_create('my_first_drop')

الإخراج:

تصدير الى Dropbox

في قطرةBox

تصدير الى Dropbox

لتحميل ملف .csv إلى ملفك Dropboxاستخدم الدالة drop_upload().

بناء الجملة الأساسي:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

الإخراج:

تصدير الى Dropbox

عند السقوطBox

تصدير الى Dropbox

يمكنك قراءة ملف CSV من Dropbox باستخدام الدالة drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

الإخراج:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

عند الانتهاء من استخدام الملف والرغبة في حذفه. تحتاج إلى كتابة مسار الملف في الدالة drop_delete()

drop_delete('my_first_drop/table_car.csv')

الإخراج:

تصدير الى Dropbox

من الممكن أيضًا حذف مجلد

drop_delete('my_first_drop')

الإخراج:

تصدير الى Dropbox

ملخص

يمكننا تلخيص جميع الوظائف في الجدول أدناه

المكتبة الهدف الوظيفة
قاعدة تصدير ملف CSV write.csv()
XLSX تصدير التفوق الكتابة.xlsx()
ملاذ تصدير برنامج spss write_sav()
ملاذ تصدير ساس write_sas()
ملاذ تصدير البيانات write_dta()
قاعدة تصدير ر حفظ()
جوجل درايف تحميل Google Drive Drive_upload()
جوجل درايف فتح في Google Drive Drive_browse()
جوجل درايف استرجاع معرف الملف Drive_get(as_id())
جوجل درايف التحميل من Google Drive download_google()
جوجل درايف إزالة الملف من Google Drive Drive_rm()
rdrop 2 المصادقة drop_auth()
rdrop 2 قم بإنشاء مجلد drop_create()
rdrop 2 حمل الى Dropbox drop_upload()
rdrop 2 قراءة ملف CSV من Dropbox drop_read_csv
rdrop 2 احذف الملف من Dropbox drop_delete()

تلخيص هذه التدوينة بـ: