Cheerio - Получить текст с HTML-тегами, замененными пробелами - PullRequest
0 голосов
/ 10 июля 2019

Сегодня мы используем Cheerio's и, в частности, метод .text () для извлечения текста из ввода html.

Но когда HTML равен

<div>
  By<div><h2 class="authorh2">John Smith</h2></div>
</div>

Визуально на странице, / div после слова «by» обеспечивает пробел или разрыв строки. но при применении cheerio text () мы получаем неправильный результат:

ByJohn smith => что неверно, так как нам нужен пробел между By и john.

Вообще говоря, возможно ли получить текст, но немного особым образом, чтобы ЛЮБОЙ HTML-тег заменялся пробелом. (Я в порядке, чтобы потом обрезать все пробелы ...)

Мы хотели бы получить в качестве вывода Джон Смит

...