Я использую Python 2.7, чтобы найти текст в абзаце текста.
следующий текст является частью моего извлечения:
Item 1 for Product A: Flour
Solution 1 for Product A: Water
Items 2 for Product B: Milk
Solution 2 for Product B: Oil
Item 3 for Product C: Onions
Method
У меня есть следующий код Python для извлечения определенных частей информации, которую я хочу:
extract = re.findall(r"(?<=Item|s\s).*(?=\sSolution)", page_content)
Хотя это извлекает некоторую информацию, я не могу извлечь все, что мне нужно.
Мне нужно включить слово «Элемент», и я не могу извлечь последний элемент, так как следующее слово не «Решение», а «Метод».
мой желаемый результат будет:
Item 1 for Product A: Flour
Items 2 for Product B: Milk
Item 3 for Product C: Onions
любая помощь будет полезна в уточнении регулярного выражения.
спасибо