Я проверил ваши выражения.И, как упоминал Диалектик в комментарии, у вас есть конечный пробел, которого там не должно быть.
//div[@class='topnewsinfotitle ']/text()
Возвращает «пустую последовательность», см. Оценку: http://xmltools.dk/EQA-ACA6
//div[@class='topnewsinfotitle']/text()
Возвращает список ваших заголовков, см .: http://xmltools.dk/EgA2APAj
Однако, если могут быть другие классы, вы используете это (http://xmltools.dk/EwA8AJAW):
//div[contains(@class, 'topnewsinfotitle')]/text()
(я вижуони являются проблемой кодирования в предоставленных мною ссылках, однако для значения и для всех выражений XPath это не должно иметь значения, вы можете удалить /text()
, чтобы получить узлы вместо только текста)
НО, если вы владеете этим сайтом, вы должны предоставить заголовки с XML (возможно, RSS или ATOM) или JSON, которые будут иметь более высокую производительность и, что наиболее важно, будут более пуленепробиваемыми.