dask dataframe из списка кортежей python - PullRequest
0 голосов
/ 16 октября 2018

Я действительно новичок в сумерках.Я хочу создать Dask DataFrame из списка кортежей Python.В pandas вы можете использовать DataFrame.from_records для преобразования списка кортежей в кадр данных.Какая функция может дать мне такую ​​же функциональность в DASK.Мои данные выглядят примерно так

[(21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262,' booking ',' '), (21262,' booking ',' NULL ')]

Я использую этот код для выполнения задачи прямо сейчас.Это правильный способ сделать это.

import pandas as pd
import dask
import dask.dataframe as dd

names = ['id', 'status', 'reg_entry']
dfs = dask.delayed(pd.DataFrame.from_records)(cursor.fetchall(), columns=names)

df = dd.from_delayed(dfs)

1 Ответ

0 голосов
/ 16 октября 2018

Вы можете попробовать создать фрейм данных dask из существующего фрейма данных pandas (чтобы можно было использовать все конструкторы pandas):

df = pd.DataFrame([(21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', 'NULL'), (21262, 'booking', ''), (21262, 'booking', 'NULL')])
ddf = dd.from_pandas(df, npartitions=2)
...