Я смотрю на возможность реализации двунаправленной структуры синтаксического анализа текста, позволяющей обрабатывать форматированный текст с использованием комбинации общих парадигм, таких как Markdown, BBCode, DocuWiki и т. Д. На практике это означает, что каждое внедрение должно быть в состоянии переводить в общий формат и обратно. Это может быть HTML, но более реалистично промежуточный (более легко разбираемый) формат, такой как XML или YAML.
Это, вероятно, будет использовать токенизатор, чтобы разбить документ на соответствующие компоненты. Похоже ли это на лучший подход и можете ли вы предвидеть какие-либо существенные препятствия?
Наконец, кто-нибудь знает о существующих реализациях (или попытках).
Обратите внимание, что это сфокусировано на PHP, но приветствуются и другие решения.