У меня есть контент в формате:
text = """Pos no
...
... 25/gm
The Text to be
...
excluded
Pos no
...
... 46 kg
The Text to be
...
excluded
Pos no
...
... 46 xunit
End of My Text
Где, Pos no... 25/gm
- Это своего рода табличная структура, из которой мне нужно извлечь значения.
The Text to be ... excluded
- Он имеет постоянное начало (скажем, The Text to be
), но не имеет определенного конца, т. Е. excluded
может отсутствовать.
End of My Text
- Этот текст всегда будет присутствовать.
Iхочу список только с табличным содержимым, т.е.
["Pos no
...
... 25/gm",
"Pos no
...
... 46 kg",
"Pos no
...
... 46 xunit"]
Вот моя попытка, но выборочный список не получается:
re.findall(r'(Pos no .+?)(?: |The Text to be|End of My Text)', text, re.DOTALL | re.M)