Кто-нибудь знает выражение XPath, которое позволит мне извлечь все результаты поиска, полученные с baidu.com?
Например, в R я обычно делал бы что-то вроде этого:
# load libraries
library(RCurl)
library(XML)
# get webpage
doc <- getURL("http://www.baidu.com/s?rn=100&bs=chivas+regal&f=8&wd=chivas+regal")
# html structure
html <- htmlTreeParse(doc, useInternalNodes = TRUE, error=function(...){})
# use xpath expression to get links
nodes <- getNodeSet(html, "//a[@href]")
Однако это дает только около 10 ссылок, тогда как у меня должно быть около 100. Поэтому я думаю, что это означает, что в структуре baidu html есть что-то, что мне не понятно.заранее за ваше время.