преобразовать из строки в pandas датафрейм - PullRequest
0 голосов
/ 13 ноября 2018

Я импортирую CSV-файл из AWS S3 в AWS Lambdaw с кодом ниже:

file = s3.get_object(Bucket = bucket, Key = key)
rows = file['Body'].read().decode('utf-8').splitlines(False)

Я получаю данные в следующем формате:

data = "a, b, c, d, \ "x, y \", e, f "

, и я хочу вывод в следующем формате:

>>>`>>> df
   0  1  2  3    4  5  6
0  a  b  c  d  x,y  e  f`

я должен разделить данныеоснованный на ',', но если между "" есть несколько стрингов, они должны оставаться такими, как есть.

Или, если у вас есть какое-либо другое решение для импорта файла CSV из s3 в лямбду и преобразования в Data Frame,Пожалуйста, предложите

1 Ответ

0 голосов
/ 13 ноября 2018

использование csv модуль

попробуйте это,

from csv import reader
import pandas as pd
data=["a,b,c,d,\"x,y\",e,f"]
df=pd.DataFrame( list(reader(data)))
print df

Выход:

   0  1  2  3    4  5  6
0  a  b  c  d  x,y  e  f
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...