Поместите объект io.BytesIO в фрейм данных - PullRequest
0 голосов
/ 23 марта 2020

У меня есть этот байтовый объект, который я прочитал из csv в корзине s3 (не весь объект):

b'00032501;2020-03-03;-;00:00:00;00:59:03;60;3543;1;0;0\r\n00032502;2020-03-03;-;00:00:00;00:59:03;60;3543;1;0;0\r\n00067601;2020-03-03;RTL;00:00:00;00:20:19;5;1219;1;1;0\r\n00067601;2020-03-03;VOX;00:20:19;00:59:27;8;2348;1;1;0\r\n00102204;2020-03-03;-;00:00:00;00:21:56;24;1316;2;1;1\r\n00170201;2020-03-03;-;00:00:00;00:59:50;62;3590;1;0;0\r\n00170202;2020-03-03;-;00:00:00;00:59:50;62;3590;1;0;0\r\n00170801;2020-03-03;ZDF;00:00:00;00:10:13;3;613;1;1;0\r\n00187202;2020-03-03;-;00:00:00;00:24:08;26;1448;1;0;0\r\n00339802;2020-03-

Как я могу поместить его в dataframe? Теперь я использую io.BytesIO для чтения данных, но когда я помещаю их в фрейм данных с df = pd.read_csv(io.BytesIO object, dtype=str, sep=';'), они не разделяются должным образом, все столбцы находятся внутри первого. Когда я использую sep=';', он ничего не делает.

s3 = boto3.client("s3")

    if event:

        file_obj = event["Records"][0]
        filename = str(file_obj['s3']['object']['key'])

        f_obj = s3.get_object(Bucket = bucket, Key = filename)
        print(f_obj)

        file_content = f_obj["Body"].read()

        data = io.BytesIO(file_content)

        df = pd.read_csv(data)

        print(df)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...