Удаление определенных слов из строк с помощью cgi - PullRequest
0 голосов
/ 16 мая 2019

Я использую CGI для изменения HTML-файла, который загружается из поисковой системы.В этом файле присутствуют <BR> теги.Я хочу удалить только некоторые теги <BR>.

Как работает CGI, он берет весь HTML-файл и помещает его в массив.Затем каждая строка обрабатывается индивидуально, выполняя различные задачи, такие как изменение отображения и т. Д. Моя проблема в том, что мне нужен способ найти теги
в определенном диапазоне, но этот диапазон не является фиксированным, поскольку в зависимости от того, в каком поиске находится другой файл HTML, егоотослано.

То, что я до сих пор пробовал - это перебирать каждую строку.Затем проверьте в строке наличие <BR> или <br> игнорирования корпуса.Тогда, если это присутствует, я удалил это.Однако таким способом удаляются все теги <BR> в файле, что не то, что я хочу.

Это загружаемый html-файл, я буду использовать пример для одного поиска.

<b>Issue Date </b>Dec 1998<br>
  <b>Replaces </b>TR-NWT-001042 Issue01<br>
 <ul id="myNav"> <a href="#ORD">ORDERING INFORMATION</a><BR> <BR><B>ABSTRACT: </B>This document replaces TR-NWT-001042 and TR-NWT-001042-disk.<BR>
  <BR>This document presents the view of Telcordia on generic requirements for the information model of the system management interface<BR>
  between Management Systems and Synchronous Optical Network (SONET) Network Elements (NEs) using Open System Interconnection (OSI)<BR>
  management services and protocols.<BR>

То, что я хочу сделать, это после РЕЗЮМЕ: я хочу добавить в <P>.В настоящее время происходит то, что в конце каждой строки стоит <BR>, я хочу удалить все <BR> в конце каждой строки после этой точки.

В CGIфайл работает, это код, который я использовал для удаления всех <BR> в файле, я не уверен, как удалить только выбранные суммы

foreach $line(@input) {

# Put if statement, if line ends with break, remove break. 

    if ($line =~ m/<BR>$/i) {
        $line = substr $line, 0, -5;
    }

В строке выше $ содержится HTMLв строковом формате для каждой строки, а @input - это место, где хранится html-контент.

В настоящее время должно произойти то, как html-файл отображается в поисковой системе, в конце добавляются <BR>.каждой строки.Это не позволяет правильно переносить текст.Я хочу обернуть текст с помощью тега <P> и удалить символы <BR> в конце каждой строки, которые вынуждают его перейти к следующей строке.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...