Сценарий Regex для записи данных из таблицы в электронную таблицу - PullRequest
0 голосов
/ 03 апреля 2012

Я пытаюсь написать скрипт, который превратит серию базовых HTML-таблиц, описывающих конкретные варианты определенных слов в разных странах, в рабочую электронную таблицу для использования в базе данных. Каждая таблица относится к переводам одного слова в разных странах. В html он принимает формат:

<h5><a name="akas"> equivalent names in different countries </a> </h5>
<table border="0" cellpadding="2">

<tr>
<td>character string </td>

<td> country name / country name / country name</td>

</tr>

<tr>
<td>character string </td>

<td>country name</td>

</tr>

.................. этот формат продолжается до конца таблицы

</table>

Имена стран повторяются в таблицах и должны представлять заголовки столбцов в электронной таблице, в которой лежат строки эквивалентных слов. Я совершенно новичок в регулярных выражениях (в которые я нахожу действительно непонятным), а также начинающий в Javascript. Опять же, я ищу помощь в том, как преобразовать этот тип данных в рабочую электронную таблицу для использования в большой базе данных. Если бы кто-нибудь мог мне помочь, это было бы очень признательно.

Ответы [ 2 ]

1 голос
/ 03 апреля 2012

Вы должны посмотреть на DOM парсинг и XPath . XPath позволяет запрашивать html-файл для получения содержимого любого нужного вам узла.

0 голосов
/ 03 апреля 2012

Вы можете скопировать вставить таблицу HTML в электронную таблицу.

...