Меня попросили извлечь информацию академический коллега с веб-сайта, на котором мне нужно связать содержимое веб-страницы в таблице - не слишком сложно с содержимым текстового файла, который может быть только повторно проверен (насколько я можно сказать) нажав на ссылку JavaScript ... например
<a id="tk1" href="javascript:__doPostBack('tk1$ContentPlaceHolder1$grid$tk$OpenFileButton','')">
Таблица удобно находится внутри таблицы с id = 'tk1', что хорошо ... но как мне перейти по ссылке, которая тянет текстовый файл.
В идеале я хотел бы сделать это в R ... Я могу взять соответствующую таблицу в текстовом формате, сказав
u <- the url of interest...
library(XML)
tables = readHTMLTable(u)
interestingTable <- tables[grep('tk1', names(tables))]
И это даст текст в таблице, но как мне получить HTML для этой конкретной таблицы? и как мне "нажать" на кнопку и получить текстовый файл за ней?
Я отмечаю, что существует форма с массивными скрытыми значениями - сайт, кажется, управляется asp.net и использует непроницаемые URL.
Большое спасибо!