значение не отображается после фильтрации, но отображается в groupBy - PullRequest
0 голосов
/ 20 мая 2019

У меня есть фрейм данных df, где одно из полей - name (строка).

Когда я делаю:

df
.select("name")
.groupBy("name")
.count()
.show()

Я получаю:

+--------------+-------+
|     name     | count |
+--------------+-------+
| Click event  |   120 |
| Show event   |    30 |
| Delete event |    12 |
| null         |    56 |
+--------------+-------+

Однако, когда я пытаюсь:

df
.filter(col("name") === "Delete event")
.show()

, это дает мне пустоеdataframe.Это работает правильно для Show event.

Я попытался обрезать имя столбца (если в нем есть пробелы), уменьшив символы, используя like вместо ===.

Интересно, что когда я фильтрую сгруппированную базу данных следующим образом:

df
.select("name")
.groupBy("name")
.count()
.filter(col("name") === "Delete event")
.show()

она также работает, как и ожидалось.

Есть идеи, почему я могу столкнуться с этой проблемой?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...