Код зависит от libxml2
и в основном представляет собой тонкую оболочку, которая обеспечивает более удобный интерфейс для анализа html с Objective C. Это было протестировано только на iOS 3.1.3 и 3.2, если вы используете OSXВозможно, лучше исследовать использование WebKit для манипулирования вашим DOM.Следующий код может вам помочь.
//Example to download google's source and print out the urls of all the images
NSError * error = nil;
HTMLParser * parser = [[HTMLParser alloc] initWithContentsOfURL:[NSURL URLWithString:@"http://www.google.com"] error:&error];
if (error) {
NSLog(@"Error: %@", error);
return;
}
HTMLNode * bodyNode = [parser body]; //Find the body tag
NSArray * imageNodes = [bodyNode findChildTags:@"img"]; //Get all the <img alt="" />
for (HTMLNode * imageNode in imageNodes) { //Loop through all the tags
NSLog(@"Found image with src: %@", [imageNode getAttributeNamed:@"src"]); //Echo the src=""
}
[parser release];
Эта оболочка libxml для Objective C также может быть полезна.