Вы можете использовать wget
для загрузки контента при использовании файлов cookie HTTP. Я буду использовать StackOverflow.com в качестве примера цели. Вот следующие шаги:
1) Получить командный инструмент wget
. Для Mac или Linux, я думаю, что это уже доступно. В Windows его можно получить из проекта GnuWin32 или из одного из множества других портов (Cygwin, MinGW / MSYS и т. Д.).
2) Затем нам нужно получить аутентифицированный cookie, войдя на данный веб-сайт. Вы можете использовать ваш любимый браузер для этого.
В Internet Explorer вы можете создать его, используя « Меню Файл> Импорт и экспорт> Экспорт файлов cookie ». В Firefox я использовал расширение Cookie Exporter для экспорта файлов cookie в текстовый файл. Для Chrome должны быть аналогичные расширения
Очевидно, вам нужно выполнить этот шаг только один раз, если срок действия файлов cookie еще не истек!
3) Найдя экспортированный файл cookie, мы можем использовать wget для загрузки веб-страницы и предоставить ему с этим файлом cookie. Это, конечно, можно выполнить изнутри MATLAB, используя функцию SYSTEM :
%# fetch page and save it to disk
url = 'http://stackoverflow.com/';
cmd = ['wget --cookies=on --load-cookies=./cookies.txt ' url];
system(cmd, '-echo');
%# process page: I am simply viewing it using embedded browser
web( ['file:///' strrep(fullfile(pwd,'index.html'),'\','/')] )
Разбор веб-страницы - это совсем другая тема, в которую я не буду вдаваться. Получив нужные данные, вы можете взаимодействовать с электронными таблицами Excel, используя функции XLSREAD и XLSWRITE .
4) Наконец, вы можете записать это в функцию и заставить ее выполняться через регулярные интервалы , используя функцию TIMER