Правильно, трудно узнать количество строк в каждом фрагменте CSV-файла, не читая его, поэтому трудно создать индекс типа 0, 1, 2, 3, ...
, если набор данных охватывает несколько разделов.
Один подходбыло бы создать столбец из них:
df["idx"] = 1
, а затем вызвать cumsum
df["idx"] = df["idx"].cumsum()
Но учтите, что это добавляет кучу зависимостей к графу задач, который поддерживает ваш фрейм данных,поэтому некоторые операции могут быть не такими параллельными, как раньше.