Недавно я начал играть с libxml2 lib в проекте iOS для iPhone. Я прочитал несколько полезных ссылок, таких как:
http://laurentparenteau.com/blog/2009/12/parsing-xhtml-in-c-a-libxml2-tutorial/
и очень хороший пост здесь:
http://bill.dudney.net/roller/objc/entry/libxml2_push_parsing
Мне удалось получить удаленный html (с помощью ASIHTTPRequest) и успешно получить данные (NSData) о событии didReceiveData, помещенном в класс-оболочку, содержащий синтаксический анализатор, созданный с помощью htmlCreatePushParserCtxt (стиль SAX). Я хорошо получаю startDocument
и обратные вызовы endDocument. В обратных вызовах 'startElement' и 'characters' я печатаю параметр 'localname' ( const xmlChar ). В консоли я вижу, что он находит 'html', затем 'body', затем какой-то тег 'p', но затем я получаю множество неузнаваемых символов (иногда это выглядит даже как китайский ..) ...
В любом случае, прежде чем углубляться в детали кода, я хочу спросить, есть ли у кого-нибудь работающий пример синтаксического анализа (x) html с libxml2 в проекте, основанном на цели c? Я пробовал поискать в Google более двух упомянутых ссылок, но до сих пор не повезло.