JSoup для анализа тега <script> - PullRequest
       10

JSoup для анализа тега <script>

1 голос
/ 25 января 2012

У меня есть HTML с javascript, как показано ниже.

<script type="text/javascript">
if (mnt) {
      event.update();
} else {
      event.delete();;
}
cf.lmt('45000', '1131452100000', '');</script>

Как использовать JSoup для синтаксического анализа этого тега сценария и получения значения «1131452100000», которое присутствует в последней строке сценария.(что является не чем иным, как аргументом).любые входные данные приветствуются.

Ответы [ 3 ]

4 голосов
/ 25 января 2012

Боюсь, что вы не можете проанализировать javascript, используя Jsoup для извлечения ваших данных. По сути, Jsoup - это HTML-кодировщик, а HTML и javascript - это совершенно разные вещи. Вы можете видеть, что в javascript нет тегов HTML, которые может понять jsoup.

Вы можете сделать одну вещь, загрузить весь ваш контент между <script></script> тегами в строку и затем использовать regex для извлечения необходимого контента.

Вот хороший Regex Java Tutorial .

ИЛИ Вы можете попробовать использовать Rhino из Mozilla и использовать его библиотеки интеграции.

1 голос
/ 25 января 2012

Вы не можете использовать JSoup. Это анализатор HTML, а не анализатор Javascript. Попробуй Rhino. Вы должны иметь javax.script в наличии.

0 голосов
/ 04 января 2013

doc.select ( "сценарий [тип = текст / JavaScript]: нет ([SRC = ~ [A-Za-Z0-9 ./ \ s] +)");

...