регулярное выражение - PullRequest
0 голосов
/ 06 мая 2020

Я ищу несколько слов в строке кода, которую я уже написал для своего класса. Я хочу узнать, есть ли в отрывках из найденной мной литературы слова «ген» или «генет c». пока у меня есть

match = re.search(r"(gene|tic)"

, что дает мне 44 результата; однако это выражение извлекает все, что имеет в себе слова ген или генети c (например, общий или биоти c). как я могу изменить это, чтобы извлекать только ген или генети c, и ничего больше? это должно быть регулярное выражение.

Ответы [ 2 ]

0 голосов
/ 06 мая 2020

Попробуйте r"gene(?:tic)?"
ti c в конце указывать необязательно.

0 голосов
/ 06 мая 2020

Следующее регулярное выражение должно соответствовать только 3 точным словам «ген», «гены» и «geneti c».

re.search(r"(\bgene(tic|s)?\b)")

\b соответствует границам слова (начало или конец word) и (tic|s)? необязательно соответствует строке «ti c» или «s».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...