Это обсуждалось в сумерках. Сначала я укажу, что в спецификации Python len()
всегда должен возвращать конкретное целое число. Dask уважает этот блок, а также блоки len(df)
, в отличие от большинства операций над кадром данных. На .size
такого ограничения нет, поэтому оно ленивое.
Метаданные кадра данных доступны сразу, однако количество, имена и типы столбцов известны без вычисления каких-либо данных. Следовательно, .shape
будет комбинацией известного значения и ленивого или медленно вычисляемого конкретного значения. В этом нет необходимости.