Превратить список dask Series в dask DataFrame - PullRequest
1 голос
/ 27 марта 2020

У меня есть список, содержащий несколько dask Series . Каждая серия является логической и имеет одинаковую длину. Вот выдержка из трех элементов, просто чтобы показать их.

[Dask Series Structure:
npartitions=15
    bool
     ...
    ... 
     ...
     ...
Name: Sequence, dtype: bool
Dask Name: eq, 75 tasks, Dask Series Structure:
npartitions=15
    bool
     ...
    ... 
     ...
     ...
Name: Sequence, dtype: bool
Dask Name: eq, 75 tasks, Dask Series Structure:
npartitions=15
    bool
     ...
    ... 
     ...
     ...
Name: Sequence, dtype: bool
Dask Name: eq, 75 tasks]

Я превращаю этот список в dask DataFrame , где каждая серия будет представлять отдельный столбец . Я делаю это с dd.concat(List_of_series, axis=1, interleave_partitions=True).

Команда работает, но я получаю следующее UserWarning:

/home/schmat/.local/lib/python3.6/site-packages/dask/dataframe/multi.py:1056: UserWarning: Concatenating dataframes with unknown divisions.
We're assuming that the indexes of each dataframes are 
 aligned. This assumption is not generally safe.
  "Concatenating dataframes with unknown divisions.\n"

Как мне избавиться от этого предупреждения? Получившаяся конкатенация именно то, что я хочу, когда я compute() это.

...