У меня есть серия dask X
, заполненная строками, содержащими много текста, который я хочу разбить на столбцы. Вот что я делал:
cols = 2867847
W = X.str.split(n=cols, expand=True) #X has 3320 lines and npartitions=1000
Я не могу просто увеличить количество разделов для учета классификатора столбцов, потому что dask разделяет DataFrame по линиям. Можно ли вместо этого сделать столбцы над столбцами?