Все игнорируется, кроме первой ссылки при повторном вводе кода путем сбора текста из газет - PullRequest
0 голосов
/ 04 января 2019

Мне нужно собрать текст статей с нескольких URL. Код отлично работает при вводе. Однако при повторном вводе print (first_article.text) для экспорта вывода в CSV появляется только первая статья. Есть ли причина, по которой это происходит, и как можно было бы экспортировать текст из всех файлов?

import newspaper
from newspaper import Article

lista = ['url','url']

for list in lista:
   first_article = Article(url="%s" % list, language='en')
   first_article.download()
   first_article.parse()
   print(first_article.text)
#This prints all articles

print(first_article)
#This prints only one

Ссылка: Загрузка статей из нескольких URL с газетой

1 Ответ

0 голосов
/ 05 января 2019

Мне кажется, я вижу проблему. Вы хотите получить список статей. Вы можете добиться этого, добавив список:

 lista = ['url','url']
 articles = [] #initialize a list
 for list in lista:
    first_article = Article(url="%s" % list, language='en')
    first_article.download()
    first_article.parse()
    articles += [first_article.text] # Add article to list
    print(first_article.text)

 print(articles) #Print all articles
...