есть ли библиотека Objective C для разбора HTML, например Python BeautifulSoup? Спасибо
Со стороны Apple есть NSXMLDocument и NSXMLParser , которые поддерживают ввод данных в HTML. ( Руководство по программированию на основе дерева XML )
В iOS (4.3) в настоящее время нет NSXMLDocument , поэтому вам придется использовать NSXMLParser или libxml2.2.
Еще немного информации о потенциальных проблемах с синтаксическим анализом HTML: Каков наилучший подход для разбора XML / «очистки экрана» в iOS? UIWebview или NSXMLParser?
Наиболее надежным решением является использование внеэкранного WebView, загрузка в него исходного кода HTML и доступ к его дереву DOM .
Лучший способ, который я нашел, это NSXMLParser + libtidy.Однако в настоящее время доступно много сторонних библиотек, что облегчает анализ.(последний ответ был написан в 2011 году).
NSXMLParser
libtidy