Вопрос:
Существует веб-сайт https://au.pcpartpicker.com/products/cpu/overall-list/#page=1 со списком <li>
под <ul>
, каждый элемент в списке содержит <div>
с классом title в этом классе есть еще 2 <div>
элемента, у первого есть текстовый пример 3,4 ГГц 6-Core (Pinnacle Ridge) я хочу удалить весь текст, не заключенный в скобки, чтобы получить PinnacleRidge .После того, как список очищен, я хочу перейти на следующую страницу, изменив # page = .
Код:
Я не уверен, что есть только фрагменты, новот оно:
из request_html import HTMLSession session = HTMLSession ()
r = session.get('https://au.pcpartpicker.com/product/cpu/overall-list/#page=' + page)
table = r.html.find('.ul')
//not sure find each <li> get first <div>
junk, name = div.split('(')
name.replace("(", "")
name.replace(")", "")
Ожидаемый результат:
Я хочу просмотреть каждую страницу, пока не останется ни одной находкикаждый список и получая имя, его не нужно сохранять, так как у меня есть код для его сохранения при создании.
Если вам нужна дополнительная информация, пожалуйста, дайте мне знать
Спасибо