Я пытаюсь построить дерево JSON, анализируя XML-файлы. Эти файлы могут содержать ссылки на другие XML-файлы. Все файлы, которые я хотел бы проанализировать, имеют имена вроде toc\d.js
. Выводимое дерево должно иметь форму:
{
name: 'name of element',
url: 'xml_referenced.xml',
children: [
{
name: '.....',
url: '.....',
children: [...]
}
}
xml, который должен создать это, может выглядеть следующим образом (toc.xml)
<?xml version=\"1.0\" encoding=\"utf-8\" ?><data src=\"toc.js\" name=\"Using and Customizing the Application\" url=\"DA_UsingAndCustomizing.htm\"><item name=\"Adapted user interface\" url=\"DA_AdaptedUserInterface.htm\" /><item name=\"Show or hide the windows\" url=\"3402556939.htm\" /><book src=\"toc2.js\" name=\"Work with layouts\" url=\"9007202657330059.htm\" /><book src=\"toc3.js\" name=\"Adjust table views\" url=\"3402653835.htm\" /><item name=\"Use the keyboard to access the ribbon\" url=\"9007202657380875.htm\" /><item name=\"Keyboard shortcuts\" url=\"27021601196225675.htm\" /><item name=\"Lock or unlock the Data Analysis session\" url=\"27021601166795787.htm\" /><item name=\"Reset all user settings\" url=\"3402736267.htm\" /><item name=\"Find status information\" url=\"9007203112007179.htm\" /><item name=\"Navigation pane\" url=\"18014401941480331.htm\" /><item name=\"PDF Viewer\" url=\"OL_PDFViewer.htm\" /><item name=\"Review mode\" url=\"DA_ReviewMode.htm\" /><item name=\"Customize reports and results\" url=\"DA_CustomizeReportsAndResults.htm\" /><book src=\"toc4.js\" name=\"Interfaces\" url=\"DA_Interfaces.htm\" /></data>"
Как видите, он содержит элементы, которые ссылаются на другие файлы 'toc' (будут преобразованы в xml, поскольку они хранятся в формате js):
<book src=\"toc2.js\" name=\"Work with layouts\" url=\"9007202657330059.htm\" />
Функция, которую я использую для разбора, следующая:
var loadedPaths = []
var buildTOC = function(xml, srcPath){
const parseToc = function(toc){
var obj = {}
var children
if (toc.children.length){
children = toc.children // THESE ITEMS ARE INCLUDED IN THE RESULT
}
else {
children = []
}
var path = toc.attribs.src
if (path && loadedPaths.indexOf(path)<0){
loadedPaths.push(path)
lib.getXml(srcPath + '/' + toc.attribs.src).then(x => { // RETURNS XML
children = lib.buildTOC(x, srcPath) // THESE ITEMS ARE NOT INCLUDED
})
}
else {
obj.url = toc.attribs.url
obj.name = toc.attribs.name
obj.children = children.map(x => {return parseToc(x)})
}
return obj
}
var $ = this.buildDom(xml, {xmlMode: true}) // RETURNS A CHEERIO DOM
console.log([parseToc($('data')[0])])
return [parseToc($('data')[0])]
}
Результат включает только элементы <item>
и <book>
в исходном файле toc.xml. Я ожидаю, что элементы <book>
также будут включать потомки, которые являются потомками тега <data>
в таких файлах, как toc2.js, toc3.js и т. Д.
Может кто-нибудь помочь мне понять, что здесь происходит не так? Благодаря.