Справочная информация:
Я хочу использовать регулярные выражения для поиска по ключевому слову. Тем не менее, мое ключевое слово имеет несколько синонимов. Например, ключевое слово positive
может иметь следующие слова, которые я считаю равными positive
: "+", "pos", "POS", "Positive", "POSITIVE"
Я пытался посмотреть Создать фрейм данных с синонимами NLTK и http://www.nltk.org/howto/wordnet.html, но я не думаю, что это именно то, что я ищу
Цели:
1) создать синонимы для данного ключевого слова (например, positive
)
2) поиск по ключевому слову (например, positive
) в корпусе с использованием регулярных выражений
Пример:
toy_corpus = 'patient is POS which makes them ideal to treatment '
Я думаю, что шаги для получения этого будут выглядеть примерно так:
1) определить синонимы для positive
например positive
= ["pos", "POS", "Positive", "POSITIVE", "+"]
2) использовать регулярное выражение для поиска ключевого слова POS
Вопрос
Как мне добиться этого?