Я делаю проект машинного обучения на Python, который требует от меня обработки некоторых данных и преобразования их в матрицу смежности. Данные сохраняются в CSV-файлах и сохраняются следующим образом:
114787,375519
114787,285613
114787,7448
114787,4914
114787,51343
.
.
Проблема в том, что эти цифры не представляют собой индексы, а просто имена . Есть только 19000 узлов или около того, и числа в файле .csv в основном случайные имена, данные различным узлам графа.
Мне нужно поместить все это в матрицу смежности, сохраняя при этом информацию о какой индекс представлен каким именем, и я не могу на всю жизнь понять, как это сделать. Был бы очень признателен за помощь.