Существует ли анализатор HTML или какая-либо библиотека, которая автоматически преобразует таблицы HTML в строки данных CSV?
Вот некоторый скрипт на Perl. И онлайн-конвертер (необходим Java). Или вы можете просто вручную скопировать таблицу HTML из браузера в OpenOffice Calc / MS Excel и сохранить ее как CSV - это будет работать тоже.
А вот - это пошаговое решение на PHP.
вы можете попробовать этот простой скрипт PHP (также как онлайн-конвертер) http://www.scherello.de/?id=243
sed s/'<td>'//g d1.txt | sed s/'<\/td>'//g | sed s/'<\/a>'/'<\/a>,'/g | sed s/'<\/em>'/'<\/em>,'/g | sed s/'<tr>'/'<br>'/g | sed s/'<\/tr>'//g | sed s/'<th>'/'<b>'/g | sed s/'<\/th>'/'| <\/b>'/g> names1.html