Python использует заголовок или ключевое слово для печати абзаца из текстового файла - PullRequest
1 голос
/ 08 октября 2019

У меня есть текстовый файл, и я хочу найти «какое-нибудь ключевое слово» и напечатать весь этот абзац.

Текстовый файл из pdf, поэтому он выглядит так:

ССЫЛКИ

[1] Поисковая система Google: коммерческая поисковая система, основанная создателями P. aaa: // sssssss /. [2] Open Directory Pro j: веб-каталог для более чем 2,5 миллиона URL. http://z.org/. [3] «Больше зла, чем доктор Зло?»http: // sear com / sere port / 99 / 11- google.html. [4] Кришна Бхарат и Мон Ика Р. Улучшены алгоритмы дистилляции тем в гиперссылке

Теперь я могу печатать только одну строку

f = open('Desktop\\2002\\1. t x t','r')
lines = f. read lines()
for lines in lines:
   if "[1]" in lines:
       print(lines)

. Ответ: Поисковая система Google: поисковая система для коммерческих предприятий.

Мне нужно ключевое слово типа «ССЫЛКИ», и выведите: [1] Поисковая система Google: коммерческая поисковая система, основанная создателями P.

[2] Open Directory Pro ject: веб-каталог для более чем 2,5 миллиона URL. ,,.

1 Ответ

0 голосов
/ 08 октября 2019

После того, как ваш поиск нашел ключевое слово, вы можете предположить, как будут выглядеть следующие части.

Таким образом, вы можете пропустить следующую строку и после этого печатать каждую строку, пока не появится другая пустая строка.

f = open('Desktop\\2002\\1. t x t','r')
lines = f. read lines()
currentParagraph = False
for line in lines:
   if "[1]" in line and not currentParagraph:
       print(line)
       currentParagraph = True
       continue
   if currentParagraph:
       print(line)
       if line == "":
           break

Однако вы должны проверить, есть ли символы «разрыв строки» в «пустых» строках («\ n»).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...