Я ищу это определение, чтобы мой HTML рендерер немного лучше соответствовал. В настоящее время он угадывает, какие пробелы оставить, какие свернуть и что выбросить. Стандарт SGML трудно найти, и стандарт HTML, кажется, не рассматривает предмет с необходимой глубиной для моих нужд.
В настоящее время мой рендерер анализирует HTML в дерево, а затем выполняет рекурсивную передачу макета для позиционирования всех элементов и их содержимого. Я экспериментирую с выбрасыванием некоторых пробелов на этапе синтаксического анализа, то есть при определенных обстоятельствах не испускаю только пробельные фрагменты текста. Какой тип работает в большинстве случаев, но есть довольно много крайних случаев, с которыми трудно иметь дело.
(Я также работаю над подклассом редактора HTML-элемента управления, и временные решения макета оказываются в редакторе небольшой проблемой, поэтому я работаю над тем, чтобы перевести их на этап анализа. Информация о макете не доступно до времени перекомпоновки, которое наступает через некоторое время после редактирования документа.)
Огонь прочь со связью / пламенем.