Синтаксический анализ HTML с помощью синтаксического анализатора XML обычно не работает в любом случае, поскольку многие сайты имеют неправильный HTML, с которым будет работать веб-браузер, но строгий синтаксический анализатор XML, такой как NSXMLParser
, полностью не будет работать.
Для многих языков сценариев существуют большие библиотеки, которые более милосердны. Как и в модуле «Красивый суп» в Python. К сожалению, я не знаю таких модулей для Objective-C.
Загрузка материала в UIWebView
может быть самым простым способом. Обратите внимание, что вам не нужно выводить UIWebView
на экран. Вы можете создать отдельный UIWindow
и добавить к нему UIWebView
, чтобы выполнить полный вывод за пределы экрана. Я думаю, что было видео WWDC2009 об этом. Как вы уже упоминали, он не будет легким.
В зависимости от данных, которые вы хотите, и сложности страниц, которые вам нужно проанализировать, вы также можете анализировать их с помощью регулярных выражений или даже парсера, написанного от руки. Я делал это много раз, и для простых данных это хорошо работает.