Почему у Dask dataframe нет атрибута shape? - PullRequest
0 голосов
/ 28 июня 2018

Просто из любопытства, если dask включает как len (), так и размер, почему не существует и формы?

1 Ответ

0 голосов
/ 28 июня 2018

Это обсуждалось в сумерках. Сначала я укажу, что в спецификации Python len() всегда должен возвращать конкретное целое число. Dask уважает этот блок, а также блоки len(df), в отличие от большинства операций над кадром данных. На .size такого ограничения нет, поэтому оно ленивое.

Метаданные кадра данных доступны сразу, однако количество, имена и типы столбцов известны без вычисления каких-либо данных. Следовательно, .shape будет комбинацией известного значения и ленивого или медленно вычисляемого конкретного значения. В этом нет необходимости.

...