Я только начал работать над веб-сайтом, на котором полно страниц со всем их HTML-кодом в одной строке, что очень трудно читать и работать с ним.Я ищу инструмент (предпочтительно библиотеку Python), который будет принимать ввод HTML и возвращать тот же HTML без изменений, за исключением добавления разрывов строк и соответствующих отступов.(Все теги, разметка и содержимое должны быть нетронутыми.)
Библиотека не должна обрабатывать искаженный HTML;Сначала я передаю HTML через html5lib , поэтому он будет получать правильно сформированный HTML.Однако, как упоминалось выше, я бы предпочел, чтобы это не изменило саму фактическую разметку;Я доверяю html5lib и предпочел бы, чтобы он обрабатывал аспект корректности.
Во-первых, кто-нибудь знает, возможно ли это только с html5lib?(К сожалению, их документация кажется немного скудной.) Если нет, какой инструмент вы бы предложили?Я видел, как некоторые люди рекомендуют HTML Tidy, но я не уверен, что его можно настроить только для изменения пробелов.(Будет ли что-нибудь делать, кроме вставки пробелов, если для начала ему был передан правильно сформированный HTML?)