Извлечь текст между заданным набором слов, используя Python - PullRequest
0 голосов
/ 17 апреля 2020

Я прошел различные ответы перед публикацией, и все они основаны на регулярных выражениях и включают символы и специальные символы.

Вот мой вводимый текст и ожидаемый вывод. Я хочу извлечь текст между «Инвестиционная цель» и «Инвестиционная политика»

input_text

«Инвестиционная цель Обеспечить долгосрочный рост капитала, инвестируя в основном в портфель африканских стран». компании. Инвестиционная политика "

output_text:

" Обеспечить долгосрочный рост капитала, инвестируя в основном в портфель африканских компаний. "

Ответы [ 2 ]

1 голос
/ 17 апреля 2020

Альтернатива ответу Иисуса Навина:

input_text="Investment Objective    To provide long        -  term capital growth by investing primarily in a portfolio of African companies.  Investment Policy"

start_str = "Investment Objective"
startpos = input_text.find(start_str)

end_str = "Investment Policy"
endpos = input_text.find(end_str)

output_str = input_text[startpos + len(start_str):endpos]
output_str_nospaces = output_str.strip()

print(f"'{output_str}'")
print(f"'{output_str_nospaces}'")

Какие отпечатки:

'    To provide long        -  term capital growth by investing primarily in a portfolio of African companies.  '
'To provide long        -  term capital growth by investing primarily in a portfolio of African companies.'
0 голосов
/ 17 апреля 2020

Допустим, ваши черные слова:

black = ["Investment Objective","Investment Policy"]

Теперь давайте удалим его:

for i in black:
    input_text = input_text.replace(i,'').strip()

это дает:

'To provide long        -  term capital growth by investing primarily in a portfolio of African companies.'
...