Чтобы проинформировать вас, я пытаюсь найти дубликаты в наборе данных.
Я пытаюсь сделать что-то похожее на это '' '
With no1 as (
Select 'Hi I am sam'::text s
), no2 as (
Select 'Hi, I am'::text s
) Select l.S,f.S
from no1 f
join no2 l
on ('%'+f.s+'%') ILike ('%'+l.s+'%') OR ('%'+l.s+'%') ILike ('%'+f.s+'%')
' ''
Я хочу, чтобы оператор on включал в себя предложение, которое присоединится эти два столбца, так как они имеют похожие строки. Я попытался использовать pg_trgm и функции подобия, но кажется, что это должно быть сделано на стороне сервера.
, если это невозможно, не могли бы вы дать мне знать, как я могу объединить эти таблицы на основе этого условия, используя pandas