регулярное выражение для определения атрибутов встроенного стиля в теге HTML - PullRequest
0 голосов
/ 17 августа 2010

Из исходного файла html я должен идентифицировать тег с атрибутом встроенного стиля, используя java.

Например

<span id="abc" 
 style="font-size:11.0pt;font-family:'arial black','sans-serif'; color:#5f497a">

Пожалуйста, помогите

Ответы [ 2 ]

2 голосов
/ 17 августа 2010

http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html

Не анализировать HTML с регулярным выражением.Используйте правильный анализатор HTML (для Java существует множество возможностей) и извлеките нужные данные из дерева DOM.

1 голос
/ 17 августа 2010

Использование регулярных выражений - один из способов сделать это, например.

/<span[^>]*style=.*?>/

Или, в качестве альтернативы, если HTML правильно сформирован, загрузите его с помощью синтаксического анализатора, а затем используйте XPath.

//span[@style]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...