Pyspark считает неправильный номер после фильтра - PullRequest
0 голосов
/ 11 июля 2019

У меня нижеприведенный фрейм данных, и я применил следующие операции, но не дал неправильных результатов.Не могли бы вы помочь, что может быть движущей силой сценария?

joined_cases.count()

Возвращает 475

joined_cases.filter("stg_category_desc_txt in ('Bank', 'Institute')").count()

Возвращает 125

joined_cases.filter("stg_category_desc_txt not in ('Bank', 'Institute')").count()

Возвращает 287

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...