По сути, все, что я хотел бы сделать, это экспортировать всю HTML-таблицу в файл .txt (документ блокнота).
До сих пор я узнал, как настроить браузер для поиска html-страницы с таблицей.
require 'rubygems'
require 'hpricot'
require "watir-webdriver"
url = "http://www.example.com"
browser = Watir::Browser.new
browser.goto url
После запуска вышеупомянутого в cmd я теперь вижу HTML-таблицу в браузере.
Вот где я застрял. Как мне использовать Watir для
- Найди тэг
- собрать все (т. Е. HTML и текст), который находится внутри и.
- Извлеките эти результаты в текстовый файл (документ блокнота) и сохраните его в определенной папке.
К вашему сведению, HTML-таблица выглядит следующим образом ...
<table border="1" cellpadding="2">
<tr>
<th> Address </th>
<th> Council tax band </th>
<th> Annual council tax </th>
</tr>
<tr>
<td> 2, STONELEIGH AVENUE, COVENTRY, CV5 6BZ </td>
<td align="center"> F </td>
<td align="center"> £2125 </td>
</tr>
....... Вышеупомянутая строка повторяется много раз ......
</table>
Затем стол закрывается.
Итак, чтобы перефразировать мою ситуацию. Я могу использовать Watir для перехода браузера на страницу, содержащую таблицу html, но моя проблема в том, что я не уверен, как извлечь результаты (все в теге - включая html) в файл .txt, а затем сохранить этот файл .txt файл на мой компьютер.
Я бы предпочел сделать небольшие шаги с использованием Watir. Я знаю это, поэтому я просто хотел бы узнать, как извлечь таблицу и сохранить все, что я извлек в файл .txt. Я видел несколько примеров онлайн с использованием hpricot. Однако, как представляется, в большинстве примеров отсутствует код, подробно описывающий, как массив (если это правильный подход) выводится в файл .txt.
Не могли бы вы помочь, продемонстрировав, как написать простой фрагмент кода, который будет извлекать HTML-таблицу (и все, включая, и все, что между ними) в файл блокнота .txt?
Большое спасибо за ваше время.