Проблема, которую я имею, состоит в том, чтобы получить ссылку на конкретную ячейку в инфобоксе на вики-странице (см. Изображение ниже).В частности, я хотел бы получить ссылку на официальный сайт 3M после заголовка строки таблицы «Веб-сайт».Исходный код выделен на картинке.(Этот формат вики-страниц довольно обычный для вики-страниц большинства фирм. Я также планирую получить веб-сайты для многих фирм, так что это не просто собирать эту ..)
Вещи, которые я пробовал, но неt work:
# selenium:
driver.find_element_by_xpath("//table[@class='infoboxvcard']/tr[th/text()='Website']").get_attribute("href")
# lxml:
url = "https://en.wikipedia.org/wiki/3M"
req = requests.get(url)
store = etree.fromstring(req.text)
output = store.xpath("//table[@class='infobox vcard']/tr[th/text()='Website']/td")
Код, который работает для конкретной фирмы:
driver.get("https://en.wikipedia.org/wiki/3M")
website = driver.find_element_by_xpath("//*[@id='mw-content-text']/div/table[2]/tbody/tr[17]/td/span/a").get_attribute("href")
Однако, поскольку не все фирмы имеют одинаковое количество строк, этот код не будет работать при циклеболее ста фирм.
Любая помощь будет оценена!Заранее спасибо!
https://en.wikipedia.org/wiki/3M
Снимок экрана со страницы вики на 3 м:
![screenshot from 3m wiki page](https://i.stack.imgur.com/pShuj.png)