Итак, у меня есть текстовый файл с данными, которые хранятся следующим образом:
1 2 1 1082008561
3 4 1 1082123439
5 2 1 1082381991
6 7 1 1082407219
8 7 1 1082407356
9 10 1 1082408003
9 11 1 1082408053
12 13 1 1082408788
9 14 1 1082409354
9 15 1 1082409424
9 16 1 1082409495
9 17 1 1082409753
9 14 1 1082409928
Это всего лишь пример данных.Столбцы разделены пробелом.
В первом столбце есть node_from, во втором столбце - node_to, в третьем столбце - вес (не имеет значения для этой задачи), а в 4-й строке - отметка времени.
Моя задачаВыполнить оценку алгоритма adamic_adar_index можно следующим образом: разделите ссылки так, чтобы 70% из них предназначались для обучения, а 30% - для оценки.Эти 30% ссылок являются теми, которые появились последними по отметке времени (наибольшее число отметок времени появилось последним).Данные уже отсортированы по отметке времени.Сеть должна рассматриваться как ненаправленная и невзвешенная.
Заранее спасибо!