выскабливание списка имен со страницы пользователя myanimelist - PullRequest
0 голосов
/ 26 апреля 2020

Я пытаюсь составить список всех имен на этой странице https://myanimelist.net/users.php?lucky=1, хотя я не могу понять, какой путь мне нужно использовать, станьте прямо сейчас, я просто получаю ['\ n ',' \ n ',' \ n ', et c.] вместо списка имен пользователей.

from lxml import html
import requests

link = 'https://myanimelist.net/users.php?lucky=1'
page = requests.get(link)
tree = html.fromstring(page.content)
names = tree.xpath('//td[@align="center"]/text()')
print(names)

1 Ответ

1 голос
/ 26 апреля 2020

Вы можете попробовать это:

from lxml import html
import requests

link = 'https://myanimelist.net/users.php?lucky=1'
page = requests.get(link)
tree = html.fromstring(page.content)
names = tree.xpath('//td[@align="center"]/div/a/text()')
print(names)
...