Як експортувати дані з R
У цьому підручнику ми дізнаємося, як експортувати дані із середовища R у різні формати.
Щоб експортувати дані на жорсткий диск, потрібен шлях до файлу та розширення. Перш за все, шлях - це місце, де будуть зберігатися дані. У цьому посібнику ви побачите, як зберігати дані про:
- Жорсткий диск
- Google Drive
- Dropbox
По-друге, R дозволяє користувачам експортувати дані у різні типи файлів. Ми розглядаємо основне розширення файлу:
- csv
- xlsx
- RDS
- SAS
- SPSS
- STATA
Загалом, не складно експортувати дані з R.
У цьому підручнику ви дізнаєтесь-
- Експорт на жорсткий диск
- Як експортувати DataFrame у файл CSV у R
- Як експортувати дані з R у файл Excel
- Експорт даних з R до іншого програмного забезпечення
- Експорт даних з R у файл SAS
- Як експортувати дані з R у файл STATA
- Взаємодійте із хмарними службами
- Google Drive
- Експорт у Dropbox
Експорт на жорсткий диск
Для початку ви можете зберегти дані безпосередньо в робочому каталозі. Наступний код друкує шлях до вашого робочого каталогу:
directory <-getwd()directory
Вихід:
## [1] "/Users/15_Export_to_do"
За замовчуванням файл буде збережено за вказаним нижче шляхом.
Для Mac OS:
/Users/USERNAME/Downloads/
Для Windows:
C:\Users\USERNAME\Documents\
Можна, звичайно, встановити інший шлях. Наприклад, ви можете змінити шлях до папки для завантаження.
Створити кадр даних
Перш за все, давайте імпортуємо набір даних mtcars і отримаємо середнє значення mpg та disp, згруповане за передачами.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Вихід ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
Таблиця містить три рядки та три стовпці. Ви можете створити файл CSV із функцією write.csv у R.
Як експортувати DataFrame у файл CSV у R
Основний синтаксис write.csv у R для експорту DataFrame у CSV у R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Приклад:
write.csv(df, "table_car.csv")
Пояснення коду
- write.csv (df, "table_car.csv"): Створіть файл CSV на жорсткому диску:
- df: ім'я кадру даних у середовищі
- "table_car.csv": Назвіть файл table_car і збережіть його як csv
Примітка : Ви можете використовувати функцію write.csv у R як write.csv2 (), щоб розділити рядки крапкою з комою для експорту R до даних csv.
write.csv2(df, "table_car.csv")
Примітка : Тільки для педагогічних цілей ми створили функцію, яка називається open_folder (), щоб відкрити для вас папку каталогів. Вам просто потрібно запустити наведений нижче код і подивитися, де зберігається файл csv. Ви повинні побачити імена файлів table_car.csv для експорту даних R у CSV.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Як експортувати дані з R у файл Excel
Тепер ми дізнаємося, як експортувати дані з R у Excel:
Експорт даних з R у Excel є тривіальним для користувачів Windows та складнішим для користувачів Mac OS. Обидва користувачі використовуватимуть бібліотеку xlsx для створення файлу Excel. Невелика різниця полягає в установці бібліотеки. Справді, бібліотека xlsx використовує Java для створення файлу. Потрібно встановити Java, якщо вона відсутня у вашому комп'ютері, щоб експортувати Data R до Excel.
Користувачі Windows
Якщо ви користувач Windows, ви можете встановити бібліотеку безпосередньо з conda, щоб експортувати фрейм даних до Excel R:
conda install -c r r-xlsx
Після встановлення бібліотеки ви можете використовувати функцію write.xlsx (). У робочому каталозі створено нову книгу Excel для експорту R до даних Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Якщо ви користувач Mac OS, вам потрібно виконати такі дії:
- Крок 1: Встановіть останню версію Java
- Крок 2: Встановіть бібліотеку rJava
- Крок 3: Встановіть бібліотеку xlsx
Крок 1) Ви можете завантажити Java з офіційного сайту Oracle та встановити її.
Ви можете повернутися до Rstudio і перевірити, яка версія Java встановлена.
system("java -version")
На момент підручника остання версія Java - 9.0.4.
Крок 2) Вам потрібно встановити rjava в R. Ми рекомендували встановити R і Rstudio за допомогою Anaconda. Anaconda керує залежностями між бібліотеками. У цьому сенсі Anaconda впорається із тонкощами встановлення rJava.
Перш за все, вам потрібно оновити conda, а потім встановити бібліотеку. Ви можете скопіювати та вставити наступні два рядки коду в термінал.
conda - conda updateconda install -c r r-rjava
Далі відкрийте rjava в Rstudio
library(rJava)
Крок 3) Нарешті, настав час встановити xlsx. Ще раз, ви можете використовувати conda для цього:
conda install -c r r-xlsx
Як і користувачі Windows, ви можете зберігати дані за допомогою функції write.xlsx ()
library(xlsx)
Вихід:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Експорт даних з R до іншого програмного забезпечення
Експорт даних до різного програмного забезпечення настільки ж простий, як їх імпорт. Бібліотека "гавань" забезпечує зручний спосіб експорту даних
- spss
- sas
- stata
Перш за все, імпортуйте бібліотеку. Якщо у вас немає "притулку", ви можете піти сюди, щоб встановити його.
library(haven)
Файл SPSS
Нижче наведено код для експорту даних до програмного забезпечення SPSS:
write_sav(df, "table_car.sav")
Експорт даних з R у файл SAS
Так само просто, як spss, ви можете експортувати до sas
write_sas(df, "table_car.sas7bdat")
Як експортувати дані з R у файл STATA
Нарешті, бібліотека притулку дозволяє писати файл .dta.
write_dta(df, "table_car.dta")
Р.
Якщо ви хочете зберегти кадр даних або будь-який інший об'єкт R, ви можете скористатися функцією save ().
save(df, file ='table_car.RData')
Ви можете перевірити файли, створені вище, у поточному робочому каталозі
Взаємодійте із хмарними службами
Не в останню чергу, R оснащений фантастичними бібліотеками для взаємодії з послугами хмарних обчислень. Остання частина цього підручника стосується експорту / імпорту файлів із:
- Google Drive
- Dropbox
Примітка : Ця частина підручника передбачає, що ви маєте обліковий запис у Google та Dropbox. Якщо ні, ви можете швидко створити його для - Google Drive: https://accounts.google.com/SignUp?hl=uk - Dropbox: https://www.dropbox.com/h
Google Drive
Вам потрібно встановити бібліотеку googledrive, щоб отримати доступ до функції, що дозволяє взаємодіяти з Google Drive.
Бібліотека ще не доступна в Anaconda. Ви можете встановити його за допомогою коду нижче в консолі.
install.packages("googledrive")
і ви відкриваєте бібліотеку.
library(googledrive)
Для користувачів, що не користуються conda, встановити бібліотеку легко, ви можете скористатися функцією install.packages ('НАЗВА ПАКЕТУ) з назвою пакета всередині дужок. Не забувайте ''. Зверніть увагу, що R повинен автоматично встановлювати пакет у `libPaths (). Варто побачити це в дії.
Завантажити на Google Диск
Щоб завантажити файл на диск Google, вам потрібно скористатися функцією drive_upload ().
Кожного разу, коли ви перезапустите Rstudio, вам буде запропоновано дозволити доступ до Google Drive.
Основним синтаксисом drive_upload () є
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Після запуску коду вам потрібно підтвердити кілька запитань
drive_upload%<("table_car.csv", name ="table_car")
Вихід:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Наберіть 1 на консолі, щоб підтвердити доступ
Потім вас перенаправлять на Google API, щоб дозволити доступ. Клацніть Дозволити.
Після завершення автентифікації ви можете вийти з браузера.
У консолі Rstudio ви можете побачити підсумок виконаного кроку. Google успішно завантажив файл, розташований локально на Диску. Google призначив ідентифікатор кожному файлу на диску.
Ви можете побачити цей файл у електронній таблиці Google.
drive_browse("table_car")
Вихід:
Ви будете перенаправлені до електронної таблиці Google
Імпортувати з Google Диска
Завантажити файл із Google Диска з ідентифікатором зручно. Якщо ви знаєте назву файлу, ви можете отримати його ідентифікатор наступним чином:
Примітка . Залежно від підключення до Інтернету та розміру вашого Диска, це займає кілька разів.
x <-drive_get("table_car")as_id(x)
Ви зберегли ідентифікатор у змінній x. Функція drive_download () дозволяє завантажувати файл із Google Drive.
Основний синтаксис:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Ви нарешті можете завантажити файл:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Пояснення коду
- drive_download (): Функція завантаження файлу з Google Drive
- as_id (x): використовуйте ідентифікатор для перегляду файлу на Google Диску
- overwrite = TRUE: Якщо файл існує, перезапишіть його, інакше виконання зупинено Щоб локально побачити ім'я файлу, ви можете використовувати:
Вихід:
Файл зберігається у вашому робочому каталозі. Пам'ятайте, вам потрібно додати розширення файлу, щоб відкрити його в R. Ви можете створити повне ім'я за допомогою функції paste () (тобто table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Вихід:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Нарешті, ви можете видалити файл зі свого диска Google.
## remove filedrive_find("table_car") %>%drive_rm()
Вихід:
Це повільний процес. Для видалення потрібен час
Експорт у Dropbox
R взаємодіє з Dropbox через бібліотеку rdrop2. Бібліотека також не доступна в Anaconda. Ви можете встановити його через консоль
install.packages('rdrop2')
library(rdrop2)
Вам потрібно надати тимчасовий доступ до Dropbox за допомогою своїх облікових даних. Після завершення ідентифікації R може створити, видалити завантаження та завантаження у ваш Dropbox.
Перш за все, вам потрібно надати доступ до свого облікового запису. Повноваження кешуються протягом усього сеансу.
drop_auth()
Вас перенаправлять на Dropbox для підтвердження автентичності.
Ви отримаєте сторінку підтвердження. Ви можете закрити його і повернутися до R
Ви можете створити папку за допомогою функції drop_create ().
- drop_create ('my_first_drop'): Створіть папку в першій гілці Dropbox
- drop_create ('First_branch / my_first_drop'): Створіть папку всередині існуючої папки First_branch.
drop_create('my_first_drop')
Вихід:
У DropBox
Щоб завантажити файл .csv у свій Dropbox, використовуйте функцію drop_upload ().
Основний синтаксис:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Вихід:
На DropBox
Ви можете прочитати файл csv із Dropbox за допомогою функції drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Вихід:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Коли ви закінчите використовувати файл і хочете його видалити. Вам потрібно записати шлях до файлу у функції drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Вихід:
Також можна видалити папку
drop_delete('my_first_drop')
Вихід:
Резюме
Ми можемо узагальнити всі функції в таблиці нижче
Бібліотека |
Об’єктивна |
Функція |
---|---|---|
база |
Експортувати CSV |
write.csv () |
xlsx |
Експорт Excel |
write.xlsx () |
гавань |
Експорт spss |
write_sav () |
гавань |
Експорт sas |
write_sas () |
гавань |
Експортна статистика |
write_dta () |
база |
Експорт R |
зберегти () |
googledrive |
Завантажте Google Диск |
drive_upload () |
googledrive |
Відкрити на Google Диску |
drive_browse () |
googledrive |
Отримати ідентифікатор файлу |
drive_get (as_id ()) |
googledrive |
Завантажити з Google Диска |
download_google () |
googledrive |
Видаліть файл із Google Диска |
drive_rm () |
rdrop2 |
Аутентифікація |
drop_auth () |
rdrop2 |
Створіть папку |
drop_create () |
rdrop2 |
Завантажити в Dropbox |
drop_upload () |
rdrop2 |
Прочитайте csv із Dropbox |
drop_read_csv |
rdrop2 |
Видаліть файл із Dropbox |
drop_delete () |