Question

Я хочу извлечь только заголовки статей, опубликованных в определенном журнале. Чтобы быть очень точным c, я дам URL (https://www.sciencedirect.com/journal/image-and-vision-computing/vol/93/). Теперь я хочу только название статьи. Я попытался очистить дерево, но не смог. Пожалуйста, помогите.

from lxml import html
import requests

page = requests.get("https://www.sciencedirect.com/journal/image-and-vision-computing/vol/93/")
tree = html.fromstring(page.text)

что делать дальше?

Jack Fleeting · Answer 1 · 07 апреля 2020

Попробуйте что-то вроде:

    titles = tree.xpath('//span[@class="js-article-title"]')
    for title in titles:
        print(title.text)

Вывод:

Editorial Board
Transfer learning in computer vision tasks: Remember where you come from
FALF ConvNets: Fatuous auxiliary loss based filter-pruning for efficient deep CNNs
Out-of-region keypoint localization for 6D pose estimation
Region-based Fitting of Overlapping Ellipses and its application to cells segmentation

et c.

Как читать заголовки статей из научной прямой ссылки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как читать заголовки статей из научной прямой ссылки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов