ограничение вывода URL из газеты - PullRequest
0 голосов
/ 01 марта 2019

Я использую газету 3 для извлечения URL-адресов из news.google, но проблема в том, что я продолжаю получать все URL-адреса (я отключил памятку, потому что мне нужен полный список).Я хотел бы напечатать только верхние 5 ссылок или 5 случайных ссылок, на самом деле не имеет значения.Я пытался установить максимум, но это не сработало.Есть идеи?

import newspaper

news = newspaper.build('https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?oc=3&ceid=US:en', memoize_articles=False)

for article in news.articles:
    print(article.url)

1 Ответ

0 голосов
/ 01 марта 2019

Этот фрагмент кода должен быть именно тем, что вы хотите.Он не использует функцию газеты, а скорее случайный, чтобы выбрать определенное количество URL.Вывод из газеты не является списком, поэтому его необходимо преобразовать в список с помощью функции добавления.Наслаждайтесь!

import newspaper

business_news = newspaper.build('https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?hl=en-US&gl=US&ceid=US%3Aen', language='en', memoize_articles = False)

myList = []
for article in business_news.articles:
    myList.append(str(article.url))
print(myList) #not necessary just for display purposes

import random

aselect = myList
randarticles = random.sample(aselect, 5)

print(randarticles)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...