Мне нужно найти частоту каждого элемента в массиве, сохраняя при этом информацию о форме массива.Это потому, что мне нужно будет повторить это позже.
Я пробовал это решение, а также это одно.Это хорошо работает для NumPy, однако, похоже, что он не работает в Dask из-за ограничения массивов Dask, которым необходимо знать их размер для большинства операций.
import dask.array as da
arr = da.from_array([1, 1, 1, 2, 3, 4, 4])
unique, counts = da.unique(arr, return_counts=True)
print(unique)
# dask.array<getitem, shape=(nan,), dtype=int64, chunksize=(nan,)>
print(counts)
# dask.array<getitem, shape=(nan,), dtype=int64, chunksize=(nan,)>
Я ищу что-то похожее на это:
import dask.array as da
arr = da.from_array([1, 1, 1, 2, 3, 4, 4])
print(da.frequency(arr))
# {1: 3, 2: 1, 3:1, 4:2}