Я пытаюсь выполнить data.head()
, чтобы просмотреть кадр данных dask и получить следующую ошибку: TypeError: <lambda>() missing 1 required positional argument: 'df'
Эта ошибка, в частности, возникает после выполнения лямбда-функции с использованием map_partitions (как показано в коде ниже), котораяпытается добавить столбец в фрейм данных.Я вижу новый столбец, добавленный в структуру dask dataframe этой строкой, однако data.head () завершается ошибкой.
import dask.dataframe as dd
from selectolax.parser import HTMLParser
data['text'] = dd.map_partitions(
lambda df : df.apply(
lambda x : HTMLParser(x['text']).body.text(separator=' '
).replace('\n',' '),axis=1),
meta='str')
data.head()
В моем блокноте data.head () работает, пока я не выполню эту строку, поэтому яподозрение на ошибку происходит в строке, выполняющей map_partitions ().