Получение HTML-данных из веб-службы при разборе JSON - PullRequest
0 голосов
/ 15 июня 2011

я делаю разбор JSON для конкретной веб-службы с разными идентификаторами, синтаксический анализ возвращает некоторые поля, такие как «Описание, единичная стоимость, цена продажи, сводка и т. Д., В поле« Описание »я получаю данные в формате HTML, но структура HTML не уникальна для каждого ID, эти URL я использую

http://demo.s2commerce.net/DesktopModules/S2Commerce/S2Commerce.svc/rest/ProductID/8/Portal/0

http://demo.s2commerce.net/DesktopModules/S2Commerce/S2Commerce.svc/rest/ProductID/5/Portal/0

И данные, которые я получаю в поле "описание" для 3 URL ниже

1. "Описание": "

<\ / p> \ u000d \ u000a \ u000d \ u000a

Это эксклюзивное издание является еще одним ярким символом сотрудничества между Acer и Ferrari - двумя прогрессивными компаниями с гордым наследием построенный на страсти, инновациях, мощи и успехе <\ / p> \ u000d \ u000a <\ / div> \ u000d \ u000a \ u000d \ u000a

Acer безупречно разработал Ferrari 3200, внушая ему исключительную производительность, блестящую графику и молниеносное подключение. Это эксклюзивное издание является еще одним ярким символом сотрудничества между Acer и Ferrari - двумя прогрессивными компаниями с гордым наследием, основанным на страсти, инновациях, мощи и успехе. <\ / p> \ u000d \ u000a <\ / DIV> \ u000d \ u000a

<\ / р>»,

2. "Описание": "\ u000d \ u000a

Технически сложная камера" наведи и снимай ", предлагающая ряд передовых технологий, таких как двойная стабилизация изображения, технология яркой съемки и TruePic Turbo, а также Мощный 5-кратный оптический зум. <\ / p> \ u000d \ u000a <\ / div> \ u000d \ u000a \ u000d \ u000a

Olympus продолжает вводить новшества с выпуском цифровой камеры Stylus 750, технически сложной точки и камера, предлагающая ряд новаторских технологий, таких как двойная стабилизация изображения, технология Bright Capture и TruePic Turbo, а также мощный 5-кратный оптический зум, который спрятан в обтекаемый металлический всепогодный дизайн корпуса. ряд функций премиум-класса, в том числе: <\ / p> \ u000d \ u000a

* Усовершенствованная комбинация механической стабилизации изображения с ПЗС-сдвигом и цифровой стабилизации изображения для обеспечения максимально четких снимков, возможных в любой ситуации; \ u000d \ u000a * 5-кратный оптический зум-объектив с новой разработкой линзовый элемент d для сохранения компактных размеров; 2,5-дюймовый ЖК-дисплей и технология Bright Capture значительно улучшают компоновку, захват и просмотр изображений в условиях слабой освещенности; эксклюзивное TruePic Turbo Image от Olympus TruePic Процессор в сочетании с 7,1-мегапиксельным сенсором изображения для получения четкого, высококачественного p <\ / p> \ u000d \ u000a <\ / div>

я хочу получить только абзацы между тегами абзацев.

Может кто-нибудь предложить мне сделать это?

заранее спасибо

Ответы [ 2 ]

0 голосов
/ 15 июня 2011

просто посмотрите эту ссылку. Возможно ли иметь несколько стилей внутри TextView?

вам просто нужно установить строковые данные, проанализированные из json, в это текстовое представление.

0 голосов
/ 15 июня 2011

Вы можете использовать регулярные выражения.Примерно так:

String description = "test <p> some \n string <\\/p> skip this <p> another <\\/p> not in range";

...

if (!"".equals(description)) {
  Pattern p = Pattern.compile("\\Q<p>\\E[\\w|\\s]*\\Q<\\/p>\\E");
  Matcher m = p.matcher(description);
  while (m.find()) { 
    String ptag = m.group(); 
    Log.d("regex", ptag);
  } 
}

. Здесь будет найдена каждая часть текста между <p> и <\/p>.Может быть, вам понадобятся некоторые модификации.См. Все поддерживаемые инструкции RegEx в документации

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...