Я полагаю, что вы хотите получить информацию в двух таблицах Параметры вызова и Параметры размещения. Вот один простой способ сделать это, используя пакет XML
url = "http://finance.yahoo.com/q/op?s=MNTA&m=2011-05"
# extract all tables on the page
tabs = readHTMLTable(url, stringsAsFactors = F)
# locate tables containing call and put information
call_tab = tabs[[11]]
put_tab = tabs[[15]]
Я выяснил положение двух таблиц путем ручной проверки. Если позиция будет варьироваться на разных страницах, которые вы анализируете, вам может понадобиться программно определить позицию, используя длину таблицы или другие текстовые критерии.
EDIT. Две таблицы, которые, вероятно, вас заинтересуют, имеют cellpadding = 3
. Вы можете использовать эту информацию для непосредственного извлечения двух таблиц, используя следующий код
# parse url into html tree
doc = htmlTreeParse(url, useInternalNodes = T)
# find all table nodes with attribute cellpadding = 3
tab_nodes = xpathApply(doc, "//table[@cellpadding = '3']")
# parse the two nodes into tables
tabs = lapply(tab_nodes, readHTMLTable)
names(tabs) = c("calls", "puts")
Это список, который содержит обе таблицы.