Я ищу библиотеку / службу Linux, которая может конвертировать предоставленный HTML в формат XHTML-MP.Было бы прекрасно, если бы эта библиотека также знала, как изменить размеры встроенных изображений.
Взгляните на BeautifulSoup , чтобы очистить ваш HTML так, чтобы он стал хорошо сформированным.