XPath, который вам нужен, довольно близок:
//table[contains(@class, "mg-b20")]/tr[3]/td[2]//a
Я не знаю, какую библиотеку вы используете, но я подозреваю, что это Plex Parsekit API . Если это так, parsekit использует lxml.etree
в качестве базовой библиотеки, так что вы можете еще больше упростить свой код:
element = HTML.ElementFromURL(url)
alltext = element.xpath('string(//table[contains(@class, "mg-b20")]/tr[3]/td[2]//a)')
for item in alltext:
Log("text = %s" % item);
Это даже позаботится о таких случаях, как смешанный контент, например, это:
<a href="#">I am anchor text <span>But I am too and am not in Element.text</span> and I am in Element.tail</a>