У меня есть 2D (4950, 4950) массив dask, который я хочу вычислять параллельно. Используя ссылку: https://docs.dask.org/en/latest/delayed-best-practices.html#don-t-call-dask-delayed-on-other-dask-collections
print(da.shape)
partitions = da.to_delayed()
print(partitions)
delayed_values = [dask.delayed(funct)(part) for part in partitions]
print(delayed_values)
Результат, который я получаю:
(4950, 4950)
[[Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 0, 0))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 0, 1))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 0, 2))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 0, 3))]
[Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 1, 0))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 1, 1))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 1, 2))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 1, 3))]
[Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 2, 0))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 2, 1))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 2, 2))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 2, 3))]
[Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 3, 0))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 3, 1))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 3, 2))
Delayed(('gt-f3b8d1635832fc9b88447def18b4b7d0', 3, 3))]]
[Delayed('funct-c0044e9f-4b8e-4d02-b364-f6a483eaae2f'),
Delayed('funct-d2d14dcd-6f0a-4198-b999-221b0609bcaa'),
Delayed('funct-1951008c-14f4-43da-bbc1-443e90aae029'),
Delayed('funct-a254e3ba-2d45-45f8-bae4-85ba8c37a32f')]
Я хочу выяснить индекс строки (первый и последний индекс) для каждого раздела, чтобы сохранить результат вычислениядля каждого индекса в конечном выходном файле.
Я не могу найти много документации, связанной с разделами. Любая помощь / ссылка, которая может помочь найти индекс строки, высоко ценится.