парсинг источника страницы для извлечения данных таблицы и последующего экспорта в xls - PullRequest
0 голосов
/ 09 августа 2011

Мне нужно выгрузить исходный код страницы в форму и выложить ее в файл xls, содержащий содержимое таблиц страницы.

на странице, которую я хочу проанализировать, есть несколько таблиц с различными строками и 11 столбцами.У каждой таблицы есть заголовок, который мне не нужен.Я исследовал с помощью DOM, но я не мог найти способ использовать этот объект для моего приложения.Я тоже думал об использовании preg_replace (), но опять же, поскольку я имею дело с исходным кодом, я думаю, что это не сработает.

Как только я получу правильную часть разбора, я знаю, как записать ее в файл xls в php.Я просто не могу понять, как это сделать в php.Заранее спасибо.

Если это поможет, то вот так выглядит структура таблицы для каждой таблицы.

<table>
  <thead>
      <tr>
        <td>
        </td>
      </tr>
  </thead>
  <tbody>
      <tr>
        <td>
       </td>
     </tr>
 </tbody>
</table>

1 Ответ

0 голосов
/ 09 августа 2011

Это должно помочь вам начать хотя бы

$doc = new DOMDocument();
$doc->loadHTML($htmlString);

// Get all tables bodies
$tables = $doc->getElementsByTagName('tbody');

foreach ($tables as $table) {
    $rows = $table->getElementsByTagName('tr');
    foreach ($rows as $row) {
        $cells = $row->getElementsByTagName('td');
        foreach ($cells as $cell) {
            $textContent = $cell->nodeValue;
        }
    }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...