Извлечь данные из исходного файла HTML с указанным шаблоном - PullRequest
0 голосов
/ 15 ноября 2018

Я хочу проанализировать значение из исходного файла по указанному шаблону.

Допустим, у меня есть это:

Шаблон:

<div>{value}</div>
<span id="id1">{value}</span>
<div><span>{value}</span></div>

Исходный файл:

<h1>The source file can have other parts but will contain the specified template structure</h1>
<div>value 1</div>
<span id="id1">value 2</span>
<div>or a bit more complex content...<span>value 3</span><a>abc</a></div>
<h2>other file content again</h2>

Ожидаемый вывод - массив: [ значение 1, значение 2, значение 3 ]

Кто-нибудь знает модуль NodeJS для этой цели?

Спасибо!

1 Ответ

0 голосов
/ 15 декабря 2018

Кажется, для этой цели нет библиотеки. У меня есть собственное решение, думая иначе, поэтому вопрос должен быть: как я могу разобрать веб-контент. И ответ таков: мы можем использовать xpath, как описано здесь: Производительный анализ страниц с Node.js и XPath

...