как распечатать только конкретные данные из извлеченного текста? - PullRequest
0 голосов
/ 03 апреля 2019

Я уже извлек текст, но мне уже нужен раздел текста. Как распечатать только нужный раздел из текста, игнорируя все остальные?

BZN МОРЕ КАК LYS VIE OS

Раздел B Œ Перекрестные ссылки на кодовые ресурсы

ВНУТРИ: Смотреть провизо: 1. ФИНЛЯНДИЯ AY 2. ИНДИЯ 9W 3. ИТАЛИЯ Аризона 4. ЯПОНИЯ JL 5. МЕКСИКА AM 6. РОССИЯ SU 7. Соединенное Королевство БЫТЬ 8. Соединенные Штаты Америки DL 9. ВЬЕТНАМ VN

2 AF AIR FRANCE
057

Раздел C Œ Proviso

  1. В ТЕЧЕНИИ PTC2 Я хочу только раздел B, а не другое содержимое

импорт PyPDF2 pdfFileObj = open ('proviso1.pdf', 'rb') pdfReader = PyPDF2.PdfFileReader (pdfFileObj) для i в диапазоне (0,12):

pageObj = pdfReader.getPage(i)
print(pageObj.extractText())

pdfFileObj.close () * * тысяча двадцать-один

я извлек, используя это

я хочу использовать только раздел B

1 Ответ

0 голосов
/ 10 апреля 2019

Да, регулярное выражение - единственный способ, которым я могу думать.

Чтобы понять, как написать регулярное выражение согласно требованию, обратитесь к этому -

https://docs.python.org/3/howto/regex.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...