У меня большой набор данных, который содержит 30000 данных (в виде файла CSV). Данные таковы:
dataset <- data.frame(person = c(1331688384,910725927,1479941022,1606882065,1877559309),
dahak = c(9,1,4,3,2))
personid, dahak
1331688384, 9
910725927, 1
1479941022, 4
1606882065, 3
1877559309, 2
Мне нужно вычислить вес ребер из списка дахаков ... Если два числа дахаков равны, то вес это ребро равно 1, если два числа Дахака не равны, вычислите их разность и вес будет равен x.
x = 1 - (abs(as.numeric(dahak[j]) - as.numeric(dahak[k])) / 10)
Как создать взвешенную сеть с персоной в качестве узлов и вес как ребра? Теперь я могу сделать это с помощью создания матрицы и последующего использования библиотеки networkx в python или sta tnet библиотеки в R, но в матрице 900 миллионов записей! и мой ноутбук не может удержать это ... Я ищу другой путь.