Я использовал Извлечение таблицы HTML в прошлом.
Лично я нахожу его немного неуклюжим, но, возможно, я не очень хорошо понимал объектную модель.
Я обычно использую эту часть руководства для изучения данных:
use HTML::TableExtract;
$te = HTML::TableExtract->new();
$te->parse($html_string);
# Examine all matching tables
foreach $ts ($te->tables) {
print "Table (", join(',', $ts->coords), "):\n";
foreach $row ($ts->rows) {
print join(',', @$row), "\n";
}
}`