пустые результаты xpath не выводятся - PullRequest
0 голосов
/ 03 сентября 2018

Мне нужно также получить пустые значения из запроса XML, который возвращает ссылки в качестве результирующего массива. Есть несколько степеней, на которые нет ссылок для ссылки. При печати соответствующие пустые результаты не печатаются.

Цель - получить ссылки соответствующих степеней.

Мой код:

  postgraduatedegrees=tree.xpath('//*[@id="block-scholarly- 
  content"]/div/article/div/div/div//*[contains(text(),"Degree 
  of")]/text()')

  postgraduatedegreeslinks=tree.xpath('//*[@id="block-scholarly- 
  content"]/div/article/div/div/div//*[contains(text(),"Degree of")]/@href')

  Output:
   len(postgraduatedegrees)
   Out[222]: 52

  len(postgraduatedegreeslinks)
   Out[223]: 40  

Пустые значения удаляются. Пожалуйста, помогите мне решить проблему

1 Ответ

0 голосов
/ 10 сентября 2018

Решение было

url="the url of the web page"
page = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})
tree = html.fromstring(page.content)
postgraduate=tree.xpath('//*[@id="block-scholarly-content"]/div/article/div/div/div//*[contains(text(),"Degree of")]')
for pg in postgraduate:
   pgcourse= pg.xpath('.//text()')
   pglink=pg.xpath('.//@href')

Цикл for будет повторяться и с пустыми результатами.

...