Как получить количество ссылок и исходящих ссылок, используя Nutch? - PullRequest
0 голосов
/ 12 ноября 2018

Мы работаем над реализацией нашего собственного алгоритма PageRanking. Для этого мы использовали орех для ползания. Используя webgraph of nutch, мы получили базу данных outlink, inlink и node, но мы не можем прочитать ее, так как это двоичный файл. Для нашего алгоритма нам нужны эти входящие и исходящие ссылки, поэтому нам нужно прочитать эти базы данных. Как читать эти?

...