Создавайте синонимы и используйте регулярные выражения, чтобы найти ключевое слово - PullRequest
0 голосов
/ 23 мая 2019

Справочная информация:

Я хочу использовать регулярные выражения для поиска по ключевому слову. Тем не менее, мое ключевое слово имеет несколько синонимов. Например, ключевое слово positive может иметь следующие слова, которые я считаю равными positive: "+", "pos", "POS", "Positive", "POSITIVE"

Я пытался посмотреть Создать фрейм данных с синонимами NLTK и http://www.nltk.org/howto/wordnet.html, но я не думаю, что это именно то, что я ищу

Цели:

1) создать синонимы для данного ключевого слова (например, positive)

2) поиск по ключевому слову (например, positive) в корпусе с использованием регулярных выражений

Пример:

toy_corpus = 'patient is POS which makes them ideal to treatment '

Я думаю, что шаги для получения этого будут выглядеть примерно так:

1) определить синонимы для positive например positive = ["pos", "POS", "Positive", "POSITIVE", "+"]

2) использовать регулярное выражение для поиска ключевого слова POS

Вопрос

Как мне добиться этого?

1 Ответ

0 голосов
/ 23 мая 2019

Попробуйте:

import re
question = "patient is POS which makes them ideal to treatment. And the the positive"
find=["pos","POS","positive"]

words=re.findall("\n+",question)
result = [words   for words in find if words in question.split()]
print(result)
['POS', 'positive']

Где \ n - граница слова.Вики: граница слова Больше примеров: stackoverflow.com С наилучшими пожеланиями!

...