Использование Regex для получения значения между HTML-тегами - PullRequest
0 голосов
/ 16 октября 2019

Так что я знаю, что есть более простые способы сделать это, однако мне дали код и попросили попытаться заставить его работать. Вместо того, чтобы переписывать все это, я просто хотел бы, чтобы это работало.

Итак, он загружает исходный код веб-страницы, которая отображается, когда человек ищет в магазине приложений. Как только это будет сделано, я пытаюсь получить версию приложения, которая выглядит как первая строка ниже

Как только я получу код из загруженного файла, я бы хотел, чтобы он был помещен в другой файл для вызова. для дальнейшего использования, однако, если это ненужный шаг, я хочу удалить его

У меня такое ощущение, что я упускаю что-то простое.

<span class="htlgb">4.72</span>

# connects to iTunes website with Casino/Manufacturers id 
curl https://play.google.com/store/apps/details?id=${address[$a]} > json
# puts just the  version from the json file into version file
grep -Po '(?<=<span class="htlgb"> ).*?(?=</span>)' json > version
# cuts out some data so we have just a version number
current_Version=`cat version | tr -d '"' | tr -d ',' | tr -d 'version:'`

1 Ответ

0 голосов
/ 16 октября 2019

Я не профессионал bash, но это соответствует 3 группам для желаемого HTML-тега. Все, что вам нужно добавить сейчас, это выбрать значение из группы 2.

(<span class=\"htlgb\">)(.*?)(</span>)

Вы можете проверить его здесь: https://regex101.com/r/9RPycf/1

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...