Я использую node.js и puppeteer для получения некоторых данных.... все же данные отображаются без элементов строки td и т. д.Если я скопирую внешний html-файл цели, я получу это так:
<code><pre>
<strong>Date Filed File ID Code Company Name</strong>
<hr>
08-24-2018 <a href="/117-index.html">ABC/A</a> <a href="url;id=777">777</a> Company A
08-24-2018 <a href="/007-index.html">ABC/A</a> <a href="url;id=612">612</a> Company B
08-24-2018 <a href="/750-index.html">ABC/A</a> <a href="url;id=619">619</a> Company C
<hr>
Как мне получить данные из этих 4 столбцов (Столбец 1: Дата заполнена, Столбец 2: Файл, Столбец 3: идентификационный код и столбец 4: название компании)?
Я смотрю в инструменте разработки и вижу его вот так
<code><pre>
<strong>Date Filed File ID Code Company Name</strong>
<hr>
08-24-2018
<a href="/117-index.html">ABC/A</a>
<a href="url;id=777">777</a>
Company A 08-24-2018
<a href="/007-index.html">ABC/A</a>
<a href="url;id=612">612</a>
Company B 08-24-2018
<a href="/750-index.html">ABC/A</a>
<a href="url;id=619">619</a>
Company C
<hr>
... и когда я нажимаю на него, это выглядит так:
<code><pre>
<strong>Date Filed File ID Code Company Name</strong>
<hr>
08-24-2018
<a href="/117-index.html">ABC/A</a>
<a href="url;id=777">777</a>
Company A
08-24-2018
<a href="/007-index.html">ABC/A</a>
<a href="url;id=612">612</a>
Company B
08-24-2018
<a href="/750-index.html">ABC/A</a>
<a href="url;id=619">619</a>
Company C
<hr>
Когда я утешаю количество ссылок, я получаю 6 .... app.js
const puppeteer = require('puppeteer');
const fs = require('fs-extra');
(async function main() {
try {
const browser = await puppeteer.launch({ headless: false })
const page = await browser.newPage();
await page.goto('url', {waitUntil: 'load'});
const table = await page.waitForSelector('body table');
const rows = await page.$$('body table pre a');
console.log(rows.length);
...
} catch (e) {
console.log('our error', e);
}
})();
Но как мне получить эти данные правильно?
Редактировать: OuterHTML
<code>const pre = await page.$('body table pre');
const preVal = await page.evaluate( pre => pre.outerHTML, pre );
console.log(preVal);
<pre><strong>Date Filed File ID Code Company Name</strong><hr>08-24-2018 <a href="/117-index.html">ABC</a> <a href="url;id=777">777</a> Company A
08-24-2018 <a href="/007-index.html">ABC</a> <a href="url;id=612">612</a> Company B
08-24-2018 <a href="/750-index.html">ABC</a> <a href="url;id=619">619</a> Company C
<hr>