Я пытаюсь сохранить ссылки, которые я вычищаю с сайта, в недвоичном дереве. Ссылки выложены иерархически (очевидно). Вопрос в том, как мне сгенерировать дерево? Я имею в виду, как мне пройтись по страницам, предоставленным ссылкой, чтобы я знал, кто есть кто, чей ребенок.
Пока я могу получить ссылки первого и второго уровня, но понятия не имею, как идти отсюда, кроме того, что мне приходится рекурсивно строить его и иметь возможность остановиться, когда я доберусь до листа У меня есть).
То, о чем я думал, было что-то вроде (код на Python):
def buildTree(root):
for node in root.children:
if <end condition here>:
continue
else:
nodes = getNodes(urllib2.urlopen(node.url).read())
node.addChildren(nodes)
buildTree(node)
где корень и узлы определяются пользователем Узел класс