Можно ли извлекать изображения из автономных файлов HTML pando c? - PullRequest
1 голос
/ 02 августа 2020

Я использовал pando c с параметром --self-contain для создания HTML документов, в которых изображения встроены в код HTML как base64.

Изображение включено в IMG тег, подобный этому (где я заменил длинную строку символов base64 на заполнитель: <IMG src="data:image/png;base64,<<base64-coded characters here>>" width=672">

Теперь я хотел бы извлечь такие изображения, т.е. сделать обратное, где данные в кодировке base64 заменены ссылками на файлы и данные, преобразованные в обычные файлы PNG или JPEG, которые сохраняются на диске.

Я надеялся использовать pando c для этого преобразования, но я не смог найти вариант для этого в pando c, и я не нашел другого программного обеспечения, которое бы это делало. В идеале, решение должно быть типа оболочки / скрипта, которое можно легко включить в более длинную цепочку инструментов.

1 Ответ

1 голос
/ 05 августа 2020

Вы можете использовать pando c с опцией --extract-media. Изображения будут записаны в указанный каталог, а URL-адреса base64 будут заменены ссылками на эти файлы.

Например,

pandoc --from=html YOUR_FILE.html --extract-media=images
...