Добавление текста между 2 тегами HTML - PullRequest
0 голосов
/ 27 января 2019

Я студент 2 курса и работаю над анализом текста.

В общем, позвольте мне рассказать вам о коде, который сначала принимает текст в формате pdf, и преобразовать его в doc.txt файла, затем я обрабатываю эти данные для пары сотен строк, а затем сохраняю все предложения в этом тексте в список с именем all_text (для будущего использования), а также выбираю некоторые тексты и сохраняю их вв список с именем summary .

Наконец, проблема в этой части:

Сводный список выглядит следующим образом

summary=['Artificial Intelligence (AI) is a science and a set of computational technologies that are inspired by—but typically operate quite differently from—the ways people use their nervous systems and bodies to sense, learn, reason, and take action.','In reality, AI is already changing our daily lives, almost entirely in ways that improve human health, safety,and productivity.','AI is also changing how people interact with technology.']

То, что я хочу, эточитать из doc.txt предложение за предложением, и, если это предложение находится в сводном списке, измените это предложение, поместив его в жирный тэг " предложение " для всех в сводном списке, вот маленький код, для которого я пыталсяэта конкретная часть не помогает полностью, но вот он

while i < len(lis):
    if lis[i] in txt:
        txt = txt.replace(lis[i], "<b>" + lis[i] + "</b>")

        print(lis[i])

   i += 1

Этот код не работал, как я ожидал, я имею в виду, что он работает для некоторых коротких предложений, но он не работает для предложений, подобных тем, которые японятия не имеюпочему это не работает, помогите мне, пожалуйста?

1 Ответ

0 голосов
/ 27 января 2019

Для этого вы можете использовать списки, например:

summary = ['sentenceE','sentenceA']
text = ['sentenceA','sentenceB','sentenceC','sentenceD','sentenceE']
output = ['<b>'+i+'</b>' if (i in summary) else i for i in text]
print(output) #prints ['<b>sentenceA</b>', 'sentenceB', 'sentenceC', 'sentenceD', '<b>sentenceE</b>']

Обратите внимание, что summary и text должны быть list с str с.

...