Как создать файл Json в хранилище Google из DataFrame? - PullRequest
0 голосов
/ 03 июля 2018

У меня есть следующий код (Python 2.7):

import pandas as pd
....
pd.DataFrame(response2.json())['results'].to_json('orders.json', orient='records')

Это сохраняет файл orders.json в моем локальном проекте. Я хочу, чтобы файл записывался в мое ведро в Google Storage, а не на локальный компьютер.

Можно ли создать файл непосредственно в хранилище или я должен создать его локально, а затем загрузить его?

Я знаю, это должно быть что-то вроде:

from google.cloud import storage
storage_client = storage.Client()
bucket = storage_client.get_bucket("MyTestBucket")
blob = bucket.blob("folderName/" + blob?!)
blob.upload_from_filename("orders.json")  # Or something with writing the DataFrame?

Может кто-нибудь помочь с этим?

1 Ответ

0 голосов
/ 03 июля 2018

Я обнаружил, что использовать datalab.storage удобнее для записи данных в Google Cloud Storage.

import datalab.storage as storage
import pandas as pd

# Define sample dataframe to write
df = pd.DataFrame(data=[{1,'product1','description1'},{2,'product2','description2'}],columns=['id','name','description'])

# Define your bucket and write to GCS
storage.Bucket('{your-bucket-name}').item('{folder}/{your-file}.json').write_to(df.to_json(),'text/json')
...