извлечение шаблона xidel из тега кнопки - PullRequest
0 голосов
/ 27 июня 2018
xidel https://www.url.com/folder -e "<button class="btn" type="BUTTON" onclick="self.location='https://www.url.com/folder/2'">Next &gt;</button>"

Я пытаюсь извлечь то, что находится между одинарными кавычками, с помощью этого шаблона xidel, и я не добираюсь быстро.

<button class="btn" type="BUTTON" onclick="self.location='{.}'">Next &gt;</button>

Должен ли я бежать от некоторых персонажей. Синтаксис сбивает с толку. Я использую это в командной строке на Windows, последняя версия.

1 Ответ

0 голосов
/ 27 июня 2018

Сначала я попробовал:

xidel -s https://www.fanfiction.net/s/12963528/1/Forced-Return -e "<button>{@onClick}</button>*"

но это дало мне 5 результатов кнопок с атрибутом onClick, поэтому мне нужно было быть более конкретным:

xidel -s https://www.fanfiction.net/s/12963528/1/Forced-Return -e "<div style='clear:both;text-align:right;'><button>{@onClick}</button></div>"

, который выдаст: self.location = '/ s / 12963528/2 / Forced-Return'

Итак, теперь нам нужно избавиться от префикса и одинарных кавычек ... RegEx подходит для этого:

xidel -s https://www.fanfiction.net/s/12963528/1/Forced-Return -e "<div style='clear:both;text-align:right;'><button>{extract(@onClick,'=.(.*).',1)}</button></div>"

Это выведет то, что вы хотели: / s / 12963528/2 / Принудительный возврат

...