Я пытаюсь проанализировать старый код SGML с помощью BeautifulSoup4 и построить дерево элементов с...
У меня есть список из 528 тыс. Документов в формате SGML, пример одного из следующих документов:...
SGML имеет множество дополнительных функций, позволяющих минимизировать разметку, таких как...
Теоретически, возможна версия Интернета с использованием TeX или Markdown, верно? (Хорошо, сайты MD...
Как аналитик данных, я постоянно работаю с файлами со структурированными данными в каком-то...
Это вопрос из прошлой экзаменационной работы. HTML был первым с использованием 1. C ++ 2. Java 3....
При просмотре HTML 4 dtd (https://www.w3.org/TR/html4/sgml/dtd.html) я вижу много описательных...
Я новичок в Perl, пытающийся прочитать файл SGML, разобрать его, затем преобразовать в XML, чтобы я...
я создаю расширенный класс SGMLParser: class URLLister(SGMLParser): def __init__(self): SGMLParser
Я пытаюсь извлечь весь контент из DTD с помощью Perl, но я не уверен, что это лучший способ сделать...
Определение ISO 1001 * обобщенной разметки гласит: Разметка должна быть строгой, чтобы можно было...
Я использую Beautiful Soup 3.2 на python 2.7.1 здесь. Я недавно пытался заставить что-то простое...
Я неправильно читаю стандарт HTML 4.01 или это Google?В HTML 4.01, если я напишу: <!DOCTYPE HTML...
Я пишу собственный OFX -> синтаксический анализатор XML на c #. В настоящее время я использую...
Кроме пробелов, кавычек, знака равенства и табуляции, какие другие символы печатаемого подмножества...
Я пишу анализатор DTD, и я немного не уверен, как расширить параметры сущностей.Например, допустим...
В соответствии со спецификацией W3C XML элемент объявляется в виде: [45] elementdecl ::= '<
Я больше привык к XML-документам и инструментам, но мне нужно разобраться с sgml. У меня есть...
У меня из базы данных появляются нестандартные символы (из-за разрывов строк). Мой валидатор HTML...
Чтение некоторые связанные вопросы заставили меня задуматься о теоретической природе HTML. Я не...
Я делаю свой проект по текстовой категоризации. У меня есть коллекция тестов по текстовой...
Я пытаюсь разобрать страницу, используя мой скрипт на python.Но тег <nobr> вместе с '&'...
Я ищу синтаксический анализатор в Java, который может анализировать документ, отформатированный в...