У меня есть два набора данных.Предполагается, что описание ремонта
Electric Component keyboard replacement
Второй набор данных - это все описания ремонта для всех клиентов, у которых была предыдущая фраза ремонта, а позже было некоторое описание ремонта.Например:
Electric Keyboard replace
Monitor Component Replacement
Mouse component
Wire Replacement
PIN part
, поэтому для этого примера я хотел бы выбрать «Замена электрической клавиатуры» из второго набора в качестве наиболее похожей фразы на «Замена клавиатуры электрического компонента»
DATA NAME;
INFILE DATALINES DSD;
length FIRST $ 1000;
INPUT FIRST $;
DATALINES;
Electric Component keyboard replacement
;
DATA COMPONENT;
INFILE DATALINES DSD;
length FIRST_B $ 1000;
INPUT FIRST_B $;
DATALINES;
Electric Keyboard replace
Monitor Component Replacement
Mouse component
Wire Replacement
PIN part
;
PROC SQL;
CREATE TABLE Possible_Matches AS
SELECT *
FROM Name AS n, COMPONENT AS b
WHERE (n.FIRST =* b.FIRST_B);
QUIT;
Он работал, используя звук как оператор, я был взволнован.Но когда я попробовал это, например, где я изменил на «замена компонента клавиатуры» вместо «Замена электрической клавиатуры».Это не идентифицировало это дало мне пустой набор данных.Я тоже пытался "сравнить", но не смог достичь.Я попробовал этот подход, так как видел несколько примеров исправления или соответствия имен и идентификаторов электронной почты.Но можно ли подобрать фразы similair и с помощью этих функций?Есть ли другое решение для достижения этой цели?Обычно мои совпадения будут переставлены словами или дополнительными словами или более короткими словами (например, замена для замены)