я хочу получить статью новостей CNN всю ссылку - PullRequest
0 голосов
/ 25 августа 2018

я хочу получить новостную статью CNN по всей ссылке

, например

по этой ссылке

  https://edition.cnn.com/search/?q=%20news&size=10

я могу показать последние 10 новостей

чтобы получить новостную ссылку, я попробовал два способа.

   html_page = urlopen(url)
   soup = BeautifulSoup(html_page, "lxml")

   cnn_paper = newspaper.build(url, memoize_articles=False)  # ~15 seconds
   n_list = []
   for article in cnn_paper.articles:
      n_list.append(article.url)

и

req = Request(url)
html_page = urlopen(req)

soup = BeautifulSoup(html_page, "lxml")
links = []
for link in soup.findAll('a'):
    links.append(link.get('href'))

, но я не могу получить новостную ссылку

Если вы перейдете на следующую страницу,я могу получить только ту же ссылку

1 Ответ

0 голосов
/ 18 сентября 2018

попробуйте вместо этого:

for link in soup.find_all('a'):
    links.append(link.get('href'))
...