Получение чисел до и после строк с помощью регулярных выражений - PullRequest
0 голосов
/ 04 мая 2020

Я хотел бы получить числа в кадре данных pandas до и после определенных ключевых слов, таких как word, words, page, pages

jobtitle
english to spanish translations and voice over recording of four short video scripts (1100 words total)
south american spanish - 5 min video 900 words translation & voice over
translate manufacturing training video script from english to spanish (word document)
translating 100 pages to spanish
translate 1500 word document from english to spanish
translate 2225 word document from english to spanish
translate page 103

Я пытался что-то как: "(?:([0-9]?[0-9])[a-zA-Z ]{0,20}(?:word|words))", но не могу понять их правильно.

1 Ответ

1 голос
/ 04 мая 2020

Вы можете использовать чередование | для сопоставления либо страницы, либо слова, за которым следует необязательный s

Для сопоставления 0 или более символов пробела, кроме новых строк, вы можете использовать [^\S\r\n]*

\b(\d+)[^\S\r\n]*(?:page|word)s?

Regex demo

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...