Редактирование HTML-файла, такого как XML-файл - PullRequest
1 голос
/ 26 августа 2010

Мне нужно конвертировать файл HTML в формат iXBRL.Формат iXBRL - это в основном html с некоторыми встроенными узлами или информацией html-файла, заключенной в теги ixbrl.Для этого мне нужно ПОИСКАТЬ и УДАЛЯТЬ некоторые узлы из файла HTML и ЗАПИСАТЬ некоторые узлы под тегами iXBRL.

Я не могу использовать XML DOM, поскольку он генерирует исключение для типа контента..Net htmldocument class не поддерживает удаление узлов и их замену, также я не вижу опции Save.

Я пытался использовать HTML Agility Pack, но он не может найти узлы из-за пространств имен в имени узлаи у него нет никакой возможности указать пространства имен (менеджер пространства имен строк в .net).

Могу ли я указать пространство имен в выражении XPATH?Как?

Может ли кто-нибудь помочь мне в редактировании файлов HTML (или XHTML) с использованием .net или любой бесплатной библиотеки.

1 Ответ

0 голосов
/ 01 марта 2011

Если вы хотите использовать XPATH с пространствами имен, вам просто нужно поставить перед узлами правильное пространство имен.

Если ваше пространство имен выглядит следующим образом:

xmlns:xbrli="http://www.xbrl.org/2003/instance"

И ваши элементы такие:

<root>
<xbrli:elementname></xbrli:elementname>
<root>

Затем вы можете выбрать их в XPATH, например:

//xbrli:elementname
...