Я использую CGI для изменения HTML-файла, который загружается из поисковой системы.В этом файле присутствуют <BR>
теги.Я хочу удалить только некоторые теги <BR>
.
Как работает CGI, он берет весь HTML-файл и помещает его в массив.Затем каждая строка обрабатывается индивидуально, выполняя различные задачи, такие как изменение отображения и т. Д. Моя проблема в том, что мне нужен способ найти теги
в определенном диапазоне, но этот диапазон не является фиксированным, поскольку в зависимости от того, в каком поиске находится другой файл HTML, егоотослано.
То, что я до сих пор пробовал - это перебирать каждую строку.Затем проверьте в строке наличие <BR>
или <br>
игнорирования корпуса.Тогда, если это присутствует, я удалил это.Однако таким способом удаляются все теги <BR>
в файле, что не то, что я хочу.
Это загружаемый html-файл, я буду использовать пример для одного поиска.
<b>Issue Date </b>Dec 1998<br>
<b>Replaces </b>TR-NWT-001042 Issue01<br>
<ul id="myNav"> <a href="#ORD">ORDERING INFORMATION</a><BR> <BR><B>ABSTRACT: </B>This document replaces TR-NWT-001042 and TR-NWT-001042-disk.<BR>
<BR>This document presents the view of Telcordia on generic requirements for the information model of the system management interface<BR>
between Management Systems and Synchronous Optical Network (SONET) Network Elements (NEs) using Open System Interconnection (OSI)<BR>
management services and protocols.<BR>
То, что я хочу сделать, это после РЕЗЮМЕ: я хочу добавить в <P>
.В настоящее время происходит то, что в конце каждой строки стоит <BR>
, я хочу удалить все <BR>
в конце каждой строки после этой точки.
В CGIфайл работает, это код, который я использовал для удаления всех <BR>
в файле, я не уверен, как удалить только выбранные суммы
foreach $line(@input) {
# Put if statement, if line ends with break, remove break.
if ($line =~ m/<BR>$/i) {
$line = substr $line, 0, -5;
}
В строке выше $ содержится HTMLв строковом формате для каждой строки, а @input - это место, где хранится html-контент.
В настоящее время должно произойти то, как html-файл отображается в поисковой системе, в конце добавляются <BR>
.каждой строки.Это не позволяет правильно переносить текст.Я хочу обернуть текст с помощью тега <P>
и удалить символы <BR>
в конце каждой строки, которые вынуждают его перейти к следующей строке.