Я начал программировать на языке Go Google, и пакет, который я пытаюсь написать, представляет собой API для обработки и создания файлов DOCX (я знаком с этой темой и думаю, что это будет хорошим способом изучения Go ). Поскольку DOCX-файлы в основном представляют собой ZIP-файлы с различными XML-файлами внутри, мне, скорее, нужен анализатор XML DOM. Однако я не смог найти ни одного нативного XML-парсера Go DOM, так как единственные, что я видел, казались очень ограниченными, и, вероятно, парсеры SAX (любой, кто использует Go, поправьте меня, если я не прав).
Итак, на прошлых выходных я написал очень простой DOM XML-парсер, который смог проанализировать один из более простых XML-файлов в пакете DOCX и вывести его обратно без изменений. В настоящее время я не собираюсь беспокоиться о поддержке пространств имен, XSLT или проверки схемы, так как они бесполезны для манипулирования файлами DOCX. У меня вопрос: какие еще стандарты и функциональность XML было бы важно включить в анализатор?
На данный момент он только создает дерево элементов и атрибутов, которое я могу изменить и сохранить. Сейчас я не работаю с элементами CDATA или escape-символами XML (хотя это будет легко сделать, и я вернусь к этому в эти выходные).