Я пытаюсь построить график структуры ссылок на веб-сайте, чтобы смоделировать, как страницы в данном домене ссылаются друг на друга. Примечание. Я не отображаю ссылки на сайты не в корневом домене.
Очевидно, что этот график может быть значительным по размеру. Один из основных запросов, которые я хочу выполнить, - подсчитать, сколько страниц напрямую ссылаются на данный URL. Я хочу выполнить это для всего графа (дрожать) так, чтобы я получил список URL-адресов и количество входящих ссылок на этот URL-адрес.
Я знаю, что одним из популярных способов сделать это было бы с помощью некоторого сокращения карт - и я все равно могу пойти по этому пути - однако у меня есть требование, чтобы иметь возможность просматривать этот отчет в (почти) реальном времени, что не Как правило, карта уменьшает дружественный.
Я быстро взглянул на neo4j и OrientDb. Хотя оба они могут моделировать отношения, которые я хочу, неясно, смогу ли я запросить их для создания нужного отчета. На данный момент я не привержен какой-либо конкретной технологии.
Любая помощь будет принята с благодарностью.
Спасибо,
Пол