Я использую Scala и Spark. Я хочу отфильтровать определенные строки из DataFrame, которые НЕ удовлетворяют ВСЕМ условиям, которые я указываю, сохраняя при этом другие строки, которые могут быть удовлетворены только одному из условий.
Например: допустим, у меня есть этот DataFrame
+-------+----+
|country|date|
+-------+----+
| A| 1|
| A| 2|
| A| 3|
| B| 1|
| B| 2|
| B| 3|
+-------+----+
и я хочу отфильтровать страну A
и даты 1
и 2
, чтобы ожидаемый результат был:
+-------+----+
|country|date|
+-------+----+
| A| 3|
| B| 1|
| B| 2|
| B| 3|
+-------+----+
Как видите, я все еще держу страну B
с датами 1
и 2
.
Я пытался использовать filter
следующим образом
df.filter("country != 'A' and date not in (1,2)")
Но выходные данные отфильтровывают все даты 1 и 2, а это не то, что я хочу.
Спасибо.