Объединение 2 таблиц в одинаковые строки - PullRequest
0 голосов
/ 31 марта 2020

Чтобы проинформировать вас, я пытаюсь найти дубликаты в наборе данных.

Я пытаюсь сделать что-то похожее на это '' '

With no1 as (
Select 'Hi I am sam'::text s
), no2 as (
Select 'Hi, I am'::text s
) Select l.S,f.S
from no1 f 
join no2 l
on ('%'+f.s+'%') ILike ('%'+l.s+'%') OR ('%'+l.s+'%') ILike ('%'+f.s+'%')

' ''

Я хочу, чтобы оператор on включал в себя предложение, которое присоединится эти два столбца, так как они имеют похожие строки. Я попытался использовать pg_trgm и функции подобия, но кажется, что это должно быть сделано на стороне сервера.

, если это невозможно, не могли бы вы дать мне знать, как я могу объединить эти таблицы на основе этого условия, используя pandas

1 Ответ

1 голос
/ 31 марта 2020

Я думаю, что вы хотите:

on f.s ilike '%' || l.s || '%' or l.s ilike '%' ||  f.s || '%'

Обоснование:

  • ilike распознает подстановочные знаки, это право операнд; в левом операнде '%' - просто буквальный знак процента, который предотвращает совпадение

  • оператор конкатенации строк в Postgres равен || (+ для чисел c значения)

...