Пожалуйста, попробуйте это:
import re
cells = browser.find_elements_by_xpath("//*[contains(local-name(), 'tr') and contains(@class, 'tableone')]")
for (e in cells):
insides = e.find_elements_by_xpath("./td")
for (i in insides):
result = re.search('\">(.*)</', i.get_attribute("outerHTML"))
print result.group(1)
То, что это делает, получает все элементы tr
, которые имеют класс tableone
, затем перебирает каждый элемент и перечисляет все tds
. Затем перебирает externalHTML каждого td
и обрезает каждую строку, чтобы получить текстовое значение.
Я думаю, он совершенно не определен и будет возвращать пустые строки. Возможно, вам понадобится еще немного поработать над конечным продуктом.