Проблема с веб-страницей - PullRequest
0 голосов
/ 30 мая 2009

Как получить основную часть содержимого с веб-страницы? ... я хочу получить только текст из тега body, все остальные теги в теле должны быть удалены ...

Кто-нибудь может мне помочь? Заранее спасибо ....

Ответы [ 3 ]

1 голос
/ 30 мая 2009

Когда вы делаете вызов через NSURLConnection, вы получите текстовые данные ASCII в форме NSMutableData с URL-адреса, который вы указали в NSURLRequest.

Оттуда вам придется анализировать его только для строк, удаляя все остальные теги. Возможно использование инструментов, упомянутых в предыдущем ответе.

1 голос
/ 30 мая 2009

Сначала выясните, в какой позиции в строке расположены теги body. Затем удалите все до открывающего тега и все после закрывающего тега, используя методы NSString.

После этого вот как убрать теги HTML из содержимого вашего тела:

http://www.objectpark.net/StrippingHTML.html

0 голосов
/ 30 мая 2009

Если вы используете UIWebView для загрузки и отображения, вы можете использовать его удобный метод stringByEvaluatingJavaScriptFromString.

NSString *jsString = @"document.getElementsByTagName('body')[0].innerHTML;";
NSString *contentOfBody = [myWebView stringByEvaluatingJavaScriptFromString:jsString];

Это должно сработать в веб-представлении. Обратите внимание, что я, возможно, немного не согласен с javescript, но я использую этот же метод в своем приложении, и он прекрасно работает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...