Возможный дубликат:
Можете ли вы привести пример разбора HTML с вашим любимым парсером?
Как извлечь содержимое из файлов HTML с помощью Perl?
Я пытаюсь использовать регулярные выражения в Perl для анализа таблицы со следующей структурой. Первая строка выглядит следующим образом:
<tr class="Highlight"><td>Time Played</a></td><td></td><td>Artist</td><td width="1%"></td><td>Title</td><td>Label</td></tr>
Здесь я хочу вынуть «Время воспроизведения», «Исполнитель», «Заголовок» и «Метка» и распечатать их в выходной файл.
Любая помощь будет высоко ценится!
Хорошо, извините ... Я пробовал много регулярных выражений, таких как:
$lines =~ / (<td>) /
OR
$lines =~ / <td>(.*)< /
OR
$lines =~ / >(.*)< /
Моя текущая программа выглядит так:
#!perl -w
open INPUT_FILE, "<", "FIRST_LINE_OF_OUTPUT.txt" or die $!;
open OUTPUT_FILE, ">>", "PLAYLIST_TABLE.txt" or die $!;
my $lines = join '', <INPUT_FILE>;
print "Hello 2\n";
if ($lines =~ / (\S.*\S) /) {
print "this is 1: \n";
print $1;
if ($lines =~ / <td>(.*)< / ) {
print "this is the 2nd 1: \n";
print $1;
print "the word was: $1.\n";
$Time = $1;
print $Time;
print OUTPUT_FILE $Time;
} else {
print "2ND IF FAILED\n";
}
} else {
print "THIS FAILED\n";
}
close(INPUT_FILE);
close(OUTPUT_FILE);