Если точная последовательность слов совпадает с одним кадром данных в другом кадре данных - PullRequest
0 голосов
/ 19 мая 2019

У меня есть 2 кадра данных, где df1 имеет столбец key1, а df2 имеет столбец key2. Здесь столбец key1 содержит значения как «билеты на арсенал», «детская ложка» И столбец key2 содержит значения как «ребенок с», «билеты»

Я использовал приведенное ниже решение, которое не дает ожидаемого результата:

var filterdf = df1.join(df2, $"key1".contains($"key2"))

filterdf.show

результат:

+--------------------+----------------+
|                key1|key2            |
+--------------------+----------------+
|          baby spoon|          baby s|
|     arsenal tickets|         tickets|
+--------------------+----------------+

Ожидаемый результат должен быть таким, как показано ниже, он не должен включать «детскую ложку». Он должен соответствовать точной последовательности слов без лишних литералов.

+--------------------+----------------+
|                key1|key2            |
+--------------------+----------------+
|     arsenal tickets|         tickets|
+--------------------+----------------+

Что мне делать, чтобы получить ожидаемый результат?

1 Ответ

0 голосов
/ 20 мая 2019

Вы можете включить функцию Trim () для удаления пробелов при передаче df2, т.е.

var filterdf = df1.join(df2, $"key1".contains(trim($"key2")))

filterdf.show
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...