Question

вместо того, чтобы найти сходство между двумя строками, я просто хочу найти сходство значения двух строк для ex.

, какие типы гиперпоточности
есть ли какие-либо категории в гиперпоточности

должно иметь сходство. До сих пор я пробовал косинусное сходство и слово moverрасстояние, но я не получаю точный результат для некоторых строк

Nikaidoh · Answer 1 · 21 октября 2019

Это то, что действительно трудно сделать. Также трудно понять, что вы подразумеваете под «точным» семантическим сходством двух фраз. Вам нужно найти «хорошую» метрику, чтобы сделать это

В любом случае, если у вас ограниченный контекст (вам не нужно делать калькулятор семантического сходства общего назначения), очень простым подходом может быть созданиетекстовый классификатор (с машинное обучение ), в котором вы определяете основные классы, которые вы хотите использовать.

Например, для ваших примеров фраз вы можете иметь два текстовых класса:

вопрос о гиперпоточности
вопрос о еде

Чем вы много тренируете свою модельфраз и вероятностей вывода вашей модели для приведенных вами примеров фраз:

"Какие типы гиперпоточности" :
- спрашивая о гиперпоточности 0,9
- спрашивая о еде 0,5
"есть ли категориив гиперпоточности "
- с запросом о гиперпоточности 0,8
- спрашивая о еде 0,4

Обе фразы классифицируются как «спрашивающие о гиперпоточности» (потому что у них более высокий балл в этих классах), а затемМожно предположить, что они похожи. Можно также использовать оценки вероятностей, чтобы сделать что-то более изощренное (используя различия в оценках и т. Д.)

Как найти семантическое значение сходства двух строк в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти семантическое значение сходства двух строк в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов