У меня есть файл xhtml, который я пытаюсь преобразовать так, чтобы:
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1 plus MathML 2.0//EN" "http://www.w3.org/TR/MathML2/dtd/xhtml-math11-f.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>yada</title>
<meta.....>
</head>
<body>
<p>Something</p>
<p>awesome</p>
</body>
</html>
становится
<title>yada</title>
<meta.....>
<p>Something</p>
<p>awesome</p>
Ключевым моментом, на который я обращаю внимание, является то, что теги <head>
и <body>
удалены из документа. Я не хочу запускать это через sed или awk, чтобы удалить их.
Все, что я пробовал, содержит все в html или преобразует все в чистый текст.
Предыстория проблемы: у меня есть резервная копия моего блога, написанная в multimarkdown, я надеюсь перевести их в другой формат, но сначала мне нужно решить эту проблему.
Примечание. Я начал с шаблона идентификации .