sumy LexRankSummarizer () правильное форматирование выходного текста - PullRequest
0 голосов
/ 26 ноября 2018

Я пытаюсь получить вывод в виде строки, используя LexRankSummarizer в sumy библиотеке.Я использую следующий код (довольно просто)

parser = PlaintextParser.from_string(text,Tokenizer('english'))
summarizer = LexRankSummarizer()
sum_1 = summarizer(parser.document,10)
sum_lex=[]
for sent in sum_1:  
    sum_lex.append(sent)

, используя приведенный выше код, я получаю вывод в виде tuple.Рассмотрим сводку, приведенную ниже для text в качестве входных данных

The Mahājanapadas were sixteen kingdoms or oligarchic republics that existed in ancient India from the sixth to fourth centuries BCE.
Two of them were most probably ganatantras (republics) and others had forms of monarchy.

. Используя приведенный выше код, я получаю вывод в виде

sum_lex = [<Sentence: The Mahājanapadas were sixteen kingdoms or oligarchic republics that existed in ancient India from the sixth to fourth centuries BCE.>,
 <Sentence: Two of them were most probably ganatantras (republics) and others had forms of monarchy.>]

Однако, если я использую print(sent) IЯ получаю правильный вывод, как указано выше.Как решить эту проблему?

1 Ответ

0 голосов
/ 26 ноября 2018

Замена sum_lex.append(sent) на sum_lex.append(str(sent)) должна сделать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...