Експорт даних з R: Як експортувати дані з R у CSV, Excel

Зміст:

Anonim

Як експортувати дані з R

У цьому підручнику ми дізнаємося, як експортувати дані із середовища R у різні формати.

Щоб експортувати дані на жорсткий диск, потрібен шлях до файлу та розширення. Перш за все, шлях - це місце, де будуть зберігатися дані. У цьому посібнику ви побачите, як зберігати дані про:

  • Жорсткий диск
  • Google Drive
  • Dropbox

По-друге, R дозволяє користувачам експортувати дані у різні типи файлів. Ми розглядаємо основне розширення файлу:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Загалом, не складно експортувати дані з R.

У цьому підручнику ви дізнаєтесь-

  • Експорт на жорсткий диск
  • Як експортувати DataFrame у файл CSV у R
  • Як експортувати дані з R у файл Excel
  • Експорт даних з R до іншого програмного забезпечення
  • Експорт даних з R у файл SAS
  • Як експортувати дані з R у файл STATA
  • Взаємодійте із хмарними службами
  • Google Drive
  • Експорт у Dropbox

Експорт на жорсткий диск

Для початку ви можете зберегти дані безпосередньо в робочому каталозі. Наступний код друкує шлях до вашого робочого каталогу:

directory <-getwd()directory

Вихід:

## [1] "/Users/15_Export_to_do" 

За замовчуванням файл буде збережено за вказаним нижче шляхом.

Для Mac OS:

/Users/USERNAME/Downloads/ 

Для Windows:

C:\Users\USERNAME\Documents\

Можна, звичайно, встановити інший шлях. Наприклад, ви можете змінити шлях до папки для завантаження.

Створити кадр даних

Перш за все, давайте імпортуємо набір даних mtcars і отримаємо середнє значення mpg та disp, згруповане за передачами.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Вихід ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Таблиця містить три рядки та три стовпці. Ви можете створити файл CSV із функцією write.csv у R.

Як експортувати DataFrame у файл CSV у R

Основний синтаксис write.csv у R для експорту DataFrame у CSV у R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Приклад:

write.csv(df, "table_car.csv")

Пояснення коду

  • write.csv (df, "table_car.csv"): Створіть файл CSV на жорсткому диску:
    • df: ім'я кадру даних у середовищі
    • "table_car.csv": Назвіть файл table_car і збережіть його як csv

Примітка : Ви можете використовувати функцію write.csv у R як write.csv2 (), щоб розділити рядки крапкою з комою для експорту R до даних csv.

write.csv2(df, "table_car.csv")

Примітка : Тільки для педагогічних цілей ми створили функцію, яка називається open_folder (), щоб відкрити для вас папку каталогів. Вам просто потрібно запустити наведений нижче код і подивитися, де зберігається файл csv. Ви повинні побачити імена файлів table_car.csv для експорту даних R у CSV.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Як експортувати дані з R у файл Excel

Тепер ми дізнаємося, як експортувати дані з R у Excel:

Експорт даних з R у Excel є тривіальним для користувачів Windows та складнішим для користувачів Mac OS. Обидва користувачі використовуватимуть бібліотеку xlsx для створення файлу Excel. Невелика різниця полягає в установці бібліотеки. Справді, бібліотека xlsx використовує Java для створення файлу. Потрібно встановити Java, якщо вона відсутня у вашому комп'ютері, щоб експортувати Data R до Excel.

Користувачі Windows

Якщо ви користувач Windows, ви можете встановити бібліотеку безпосередньо з conda, щоб експортувати фрейм даних до Excel R:

conda install -c r r-xlsx

Після встановлення бібліотеки ви можете використовувати функцію write.xlsx (). У робочому каталозі створено нову книгу Excel для експорту R до даних Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Якщо ви користувач Mac OS, вам потрібно виконати такі дії:

  • Крок 1: Встановіть останню версію Java
  • Крок 2: Встановіть бібліотеку rJava
  • Крок 3: Встановіть бібліотеку xlsx

Крок 1) Ви можете завантажити Java з офіційного сайту Oracle та встановити її.

Ви можете повернутися до Rstudio і перевірити, яка версія Java встановлена.

system("java -version")

На момент підручника остання версія Java - 9.0.4.

Крок 2) Вам потрібно встановити rjava в R. Ми рекомендували встановити R і Rstudio за допомогою Anaconda. Anaconda керує залежностями між бібліотеками. У цьому сенсі Anaconda впорається із тонкощами встановлення rJava.

Перш за все, вам потрібно оновити conda, а потім встановити бібліотеку. Ви можете скопіювати та вставити наступні два рядки коду в термінал.

conda - conda updateconda install -c r r-rjava

Далі відкрийте rjava в Rstudio

library(rJava)

Крок 3) Нарешті, настав час встановити xlsx. Ще раз, ви можете використовувати conda для цього:

conda install -c r r-xlsx

Як і користувачі Windows, ви можете зберігати дані за допомогою функції write.xlsx ()

library(xlsx)

Вихід:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Експорт даних з R до іншого програмного забезпечення

Експорт даних до різного програмного забезпечення настільки ж простий, як їх імпорт. Бібліотека "гавань" забезпечує зручний спосіб експорту даних

  • spss
  • sas
  • stata

Перш за все, імпортуйте бібліотеку. Якщо у вас немає "притулку", ви можете піти сюди, щоб встановити його.

library(haven) 

Файл SPSS

Нижче наведено код для експорту даних до програмного забезпечення SPSS:

write_sav(df, "table_car.sav") 

Експорт даних з R у файл SAS

Так само просто, як spss, ви можете експортувати до sas

write_sas(df, "table_car.sas7bdat")

Як експортувати дані з R у файл STATA

Нарешті, бібліотека притулку дозволяє писати файл .dta.

write_dta(df, "table_car.dta")

Р.

Якщо ви хочете зберегти кадр даних або будь-який інший об'єкт R, ви можете скористатися функцією save ().

save(df, file ='table_car.RData')

Ви можете перевірити файли, створені вище, у поточному робочому каталозі

Взаємодійте із хмарними службами

Не в останню чергу, R оснащений фантастичними бібліотеками для взаємодії з послугами хмарних обчислень. Остання частина цього підручника стосується експорту / імпорту файлів із:

  • Google Drive
  • Dropbox

Примітка : Ця частина підручника передбачає, що ви маєте обліковий запис у Google та Dropbox. Якщо ні, ви можете швидко створити його для - Google Drive: https://accounts.google.com/SignUp?hl=uk - Dropbox: https://www.dropbox.com/h

Google Drive

Вам потрібно встановити бібліотеку googledrive, щоб отримати доступ до функції, що дозволяє взаємодіяти з Google Drive.

Бібліотека ще не доступна в Anaconda. Ви можете встановити його за допомогою коду нижче в консолі.

install.packages("googledrive") 

і ви відкриваєте бібліотеку.

library(googledrive)

Для користувачів, що не користуються conda, встановити бібліотеку легко, ви можете скористатися функцією install.packages ('НАЗВА ПАКЕТУ) з назвою пакета всередині дужок. Не забувайте ''. Зверніть увагу, що R повинен автоматично встановлювати пакет у `libPaths (). Варто побачити це в дії.

Завантажити на Google Диск

Щоб завантажити файл на диск Google, вам потрібно скористатися функцією drive_upload ().

Кожного разу, коли ви перезапустите Rstudio, вам буде запропоновано дозволити доступ до Google Drive.

Основним синтаксисом drive_upload () є

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Після запуску коду вам потрібно підтвердити кілька запитань

drive_upload%<("table_car.csv", name ="table_car")

Вихід:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Наберіть 1 на консолі, щоб підтвердити доступ

Потім вас перенаправлять на Google API, щоб дозволити доступ. Клацніть Дозволити.

Після завершення автентифікації ви можете вийти з браузера.

У консолі Rstudio ви можете побачити підсумок виконаного кроку. Google успішно завантажив файл, розташований локально на Диску. Google призначив ідентифікатор кожному файлу на диску.

Ви можете побачити цей файл у електронній таблиці Google.

drive_browse("table_car")

Вихід:

Ви будете перенаправлені до електронної таблиці Google

Імпортувати з Google Диска

Завантажити файл із Google Диска з ідентифікатором зручно. Якщо ви знаєте назву файлу, ви можете отримати його ідентифікатор наступним чином:

Примітка . Залежно від підключення до Інтернету та розміру вашого Диска, це займає кілька разів.

x <-drive_get("table_car")as_id(x)

Ви зберегли ідентифікатор у змінній x. Функція drive_download () дозволяє завантажувати файл із Google Drive.

Основний синтаксис:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Ви нарешті можете завантажити файл:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Пояснення коду

  • drive_download (): Функція завантаження файлу з Google Drive
  • as_id (x): використовуйте ідентифікатор для перегляду файлу на Google Диску
  • overwrite = TRUE: Якщо файл існує, перезапишіть його, інакше виконання зупинено Щоб локально побачити ім'я файлу, ви можете використовувати:

Вихід:

Файл зберігається у вашому робочому каталозі. Пам'ятайте, вам потрібно додати розширення файлу, щоб відкрити його в R. Ви можете створити повне ім'я за допомогою функції paste () (тобто table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Вихід:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Нарешті, ви можете видалити файл зі свого диска Google.

## remove filedrive_find("table_car") %>%drive_rm()

Вихід:

Це повільний процес. Для видалення потрібен час

Експорт у Dropbox

R взаємодіє з Dropbox через бібліотеку rdrop2. Бібліотека також не доступна в Anaconda. Ви можете встановити його через консоль

install.packages('rdrop2')
library(rdrop2)

Вам потрібно надати тимчасовий доступ до Dropbox за допомогою своїх облікових даних. Після завершення ідентифікації R може створити, видалити завантаження та завантаження у ваш Dropbox.

Перш за все, вам потрібно надати доступ до свого облікового запису. Повноваження кешуються протягом усього сеансу.

drop_auth()

Вас перенаправлять на Dropbox для підтвердження автентичності.

Ви отримаєте сторінку підтвердження. Ви можете закрити його і повернутися до R

Ви можете створити папку за допомогою функції drop_create ().

  • drop_create ('my_first_drop'): Створіть папку в першій гілці Dropbox
  • drop_create ('First_branch / my_first_drop'): Створіть папку всередині існуючої папки First_branch.
drop_create('my_first_drop')

Вихід:

У DropBox

Щоб завантажити файл .csv у свій Dropbox, використовуйте функцію drop_upload ().

Основний синтаксис:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Вихід:

На DropBox

Ви можете прочитати файл csv із Dropbox за допомогою функції drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Вихід:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Коли ви закінчите використовувати файл і хочете його видалити. Вам потрібно записати шлях до файлу у функції drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Вихід:

Також можна видалити папку

drop_delete('my_first_drop')

Вихід:

Резюме

Ми можемо узагальнити всі функції в таблиці нижче

Бібліотека

Об’єктивна

Функція

база

Експортувати CSV

write.csv ()

xlsx

Експорт Excel

write.xlsx ()

гавань

Експорт spss

write_sav ()

гавань

Експорт sas

write_sas ()

гавань

Експортна статистика

write_dta ()

база

Експорт R

зберегти ()

googledrive

Завантажте Google Диск

drive_upload ()

googledrive

Відкрити на Google Диску

drive_browse ()

googledrive

Отримати ідентифікатор файлу

drive_get (as_id ())

googledrive

Завантажити з Google Диска

download_google ()

googledrive

Видаліть файл із Google Диска

drive_rm ()

rdrop2

Аутентифікація

drop_auth ()

rdrop2

Створіть папку

drop_create ()

rdrop2

Завантажити в Dropbox

drop_upload ()

rdrop2

Прочитайте csv із Dropbox

drop_read_csv

rdrop2

Видаліть файл із Dropbox

drop_delete ()