Это очень старая тема, но, может быть, кто-то вроде меня столкнется с ней.
Я сделал несколько дополнений для скрипта audiodude , чтобы прочитать html из файла, вместо этого добавив его в код, и еще один параметр, управляющий печатью строк заголовка.
скрипт должен запускаться так
ruby <script_name> <file_name> [<print_headers>]
код:
require 'nokogiri'
print_header_lines = ARGV[1]
File.open(ARGV[0]) do |f|
table_string=f
doc = Nokogiri::HTML(table_string)
doc.xpath('//table//tr').each do |row|
if print_header_lines
row.xpath('th').each do |cell|
print '"', cell.text.gsub("\n", ' ').gsub('"', '\"').gsub(/(\s){2,}/m, '\1'), "\", "
end
end
row.xpath('td').each do |cell|
print '"', cell.text.gsub("\n", ' ').gsub('"', '\"').gsub(/(\s){2,}/m, '\1'), "\", "
end
print "\n"
end
end