Как предотвратить изменение формата файла HTML при обработке файла HTML с помощью cheerio - PullRequest
0 голосов
/ 19 сентября 2019

Если я выполняю следующий скрипт, разрывы строк вставляются в HTML или разрывы строк удаляются.
Не могли бы вы сказать мне, как справиться с этим?


Улучшенный скрипт
(Этот скрипт сохраняет разрывы строк.)

const fs = require('fs');
const cheerio = require('cheerio');
const someFile = 'foo.html';
const beautify = require('js-beautify');
const beautifyOptions = {
  indent_size: 2,
  preserve_newlines: true,
  max_preserve_newlines: 0,
  extra_liners: [],
  indent_empty_lines: true
};

fs.readFile(someFile, 'utf8', (err,data) => {
  let $ = cheerio.load(data, { decodeEntities: false });
  let result = $.html();
    result = beautify.html(result, beautifyOptions);

  fs.writeFile(someFile, result, 'utf8', () => {});
});

Скрипт

const fs = require('fs');
const cheerio = require('cheerio');
const someFile = 'foo.html';

fs.readFile(someFile, 'utf8', (err,data) => {
  let $ = cheerio.load(data, { decodeEntities: false })
  const result = $.html();

  fs.writeFile(someFile, result, 'utf8', () => {});
});

HTML (до)

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <meta http-equiv="X-UA-Compatible" content="ie=edge">
  <title>Document</title>
</head>
<body>
  <div class="test">aaaaa</div>
</body>
</html>

HTML (после)

<!DOCTYPE html><html lang="en"><head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <meta http-equiv="X-UA-Compatible" content="ie=edge">
  <title>Document</title>
</head>
<body>
  <div class="test">aaaaa</div>

</body></html>
...