Dask (i python) выделение строк с минимальным количеством - PullRequest
0 голосов
/ 23 апреля 2020

Проблема в dask:

В наборе данных "df_dat" есть несколько столбцов, из которых один: "target_id", если для значения "target_id" есть хотя бы 501 строка, я хочу назначить его для новый набор данных "X" (добавьте все строки с этим target_id).

X = df_dat [df_dat.target_id.value_count ()> 500]

Ошибка, которую я получаю: ' Объект Series не имеет атрибута «value_count» Так что я знаю, что при применении «.value_count ()» он не допускается на фрейме данных, поэтому я выбираю столбец «target_id», но ошибка по-прежнему сохраняется.

PS, я новичок в этом, так что это, наверное, что-то очевидное, заранее спасибо!

1 Ответ

0 голосов
/ 23 апреля 2020

может быть, вы хотите попробовать value_counts возражать 's' :)

...