Мне нужно добавить столбец в мой кадр данных DASK, который должен содержать идентификаторы автоинкремента. У меня есть идея, как это сделать в Pandas, так как я нашел решение Pandas для SO, но я не могу понять, как это сделать в DASK. Моя лучшая попытка выглядит следующим образом, и получается, что функция автоинкремента запускается только дважды для моего 100-строчного тестового файла, и все идентификаторы равны 2.
def autoincrement(self):
print('*')
self.report_line = self.report_line + 1
return self.report_line
self.df = self.df.map_partitions(
lambda df: df.assign(raw_report_line=self.autoincrement())
)
Способ Pandas выглядит примерно так
df.insert(0, 'New_ID', range(1, 1 + len(df)))
В качестве альтернативы , если я могу извлечь номер строки указанной строки c CSV и добавить ее в столбец, что было бы здорово, на данном этапе это не казаться легко возможным.