Я пытаюсь использовать dask dataframe map_partition, чтобы применить функцию, которая обращается к значению в индексе dataframe, по очереди и создает новый столбец.
Ниже приведен код, который я пробовал.
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame(index = ["row0" , "row1","row2","row3","row4"])
df
ddf = dd.from_pandas(df, npartitions=2)
res = ddf.map_partitions(lambda df: df.assign(index_copy= str(df.index)),meta={'index_copy': 'U' })
res.compute()
Я ожидаю, что df.index будет значением индекса строки, а не всего индекса раздела, на который он ссылается. Из документа здесь это хорошо работает для столбцов, но не для индекса.