Чтение CSV в Rstudio из облачного хранилища Google - PullRequest
0 голосов
/ 25 октября 2019

Я хочу прочитать CSV-файл из облачного хранилища Google с помощью функции, аналогичной

read.csv.

Я использовал библиотеку googleCloudStorageR и я не могу найти функцию для этого. Я не хочу загружать его, я просто хочу прочитать его в такой среде, как фрейм данных.

1 Ответ

0 голосов
/ 31 октября 2019

Я попытался запустить пример CSV-файла с помощью функции as.data.frame ().

Чтобы запустить этот фрагмент кода, убедитесь, что вы установили (install.packages ("data.table")) и включили библиотеку библиотеки ("data.table"). Также убедитесь, что вы включили fread () внутри функции as.data.frame () для чтения файла из его местоположения.

Вот фрагмент кода, который я запустил и сумел отобразить фрейм данных для моего набора данных:

library(“data.table”)

MyData <- as.data.frame(fread(file="$FILE_PATH",header=TRUE, sep = ','))

print(MyData)

Чтение данных с помощью TensorFlow:

Существует еще один способ чтения csv из облачного хранилища с помощью API TensorFlow. Я предполагаю, что вы получаете доступ к этим данным из ведра? Во-первых, вам нужно установить пакеты «readr» и «cloudml», чтобы эти функции работали. Затем вам нужно будет использовать gs_data_dir («gs: // your-bucket-name») вместе с указанием пути к файлу file.path (data_dir, «thing.csv »). Затем вы захотите прочитать данные из пути к файлу с помощью read_csv (file.path (data_dir, «thing.csv »)). Если вы хотите, чтобы он был отформатирован как фрейм данных, он должен выглядеть примерно так:

library(“data.table”)
library(cloudml)
library(readr)

data_dir <- gs_data_dir(“gs://your-bucket-name”)

MyData <- as.data.frame(read_csv(file.path(data_dir, “something.csv”)))

print(MyData)

Убедитесь, что вы правильно аутентифицировали доступ к своему хранилищу

Дополнительная информация по этой ссылке

...