Как извлечь текстовый контент из SGML DTD с помощью Perl? - PullRequest
0 голосов
/ 23 февраля 2012

Я пытаюсь извлечь весь контент из DTD с помощью Perl, но я не уверен, что это лучший способ сделать это. Я знаю, что есть модули для работы с XML, но я не уверен, есть ли какие-либо для этого типа работы с SGML или я должен попытаться создать регулярное выражение для этой работы?

Я новичок в SGML и Perl, у меня нет большого опыта работы с регулярными выражениями, за исключением очень простого сопоставления с образцом.

1 Ответ

2 голосов
/ 23 февраля 2012

У вас есть 2 варианта:

  • использовать старый дистрибутив perlSGML , который я использовал в (удаленном!) Прошлом.Этот perl должен работать на современном perl,

  • конвертировать ваш SGML в XML, используя osx, который является частью openSP и доступен как минимум для Debian / Ubuntu (пакетназываемый opensp) и, скорее всего, другими платформами, затем используйте инструменты XML, такие как XML :: LibXML или XML :: Twig

В наши дни инструментов XML намного больше, чем инструментов SGML, но, конечно, вы можете потерять некоторую информацию, поскольку DTD немного проще в XML, чем в SGML

...