Использование Google Datalab: записать CSV в хранилище - PullRequest
0 голосов
/ 27 июня 2018

Я пытаюсь использовать Google datalab, но я не могу написать CSV в GCS (Google Cloud Storage).

import pandas as pd
from pandas import DataFrame
from io import BytesIO
df = DataFrame({"a":[1,2],"b":1})
print(df)
>>    | a | b
>>  0 | 1 | 1
>>  1 | 2 | 1

В stackoverflow я нашел эту команду

%storage write --object gs://my-bucket/data/test.csv --variable df

Но если я использую эту команду, чтение данных не работает хорошо. Потому что данные не разделяются запятой (через пробел). и включает в себя индекс.

%storage read --object gs://my-bucket/data/test.csv --variable test_file

df2 = pd.read_csv(BytesIO(test_file))
print(df2)
>>    | a b
>>  0 | 0 1 1
>>  1 | 1 2 1

Я хочу написать как CSV без индекса. (Например, df.to_csv('test_file.csv',index=False)

Как мне поступить? Пожалуйста, совет.

1 Ответ

0 голосов
/ 27 июня 2018

Можете ли вы попробовать следующее?

import pandas as pd
from io import BytesIO
df = pd.DataFrame({"a":[1,2],"b":1})
df.to_csv('text.csv', index = False)
!gsutil cp 'text.csv' 'gs://path-to-your-bucket/test.csv'
%gcs read --object gs://path-to-your-bucket/test.csv --variable test_file
df2 = pd.read_csv(BytesIO(test_file))
...