У меня есть 2 кадра данных, где df1 имеет столбец key1, а df2 имеет столбец key2. Здесь столбец key1 содержит значения как «билеты на арсенал», «детская ложка» И столбец key2 содержит значения как «ребенок с», «билеты»
Я использовал приведенное ниже решение, которое не дает ожидаемого результата:
var filterdf = df1.join(df2, $"key1".contains($"key2"))
filterdf.show
результат:
+--------------------+----------------+
| key1|key2 |
+--------------------+----------------+
| baby spoon| baby s|
| arsenal tickets| tickets|
+--------------------+----------------+
Ожидаемый результат должен быть таким, как показано ниже, он не должен включать «детскую ложку». Он должен соответствовать точной последовательности слов без лишних литералов.
+--------------------+----------------+
| key1|key2 |
+--------------------+----------------+
| arsenal tickets| tickets|
+--------------------+----------------+
Что мне делать, чтобы получить ожидаемый результат?