Как найти ссылки / ребра из одного файла CSV? - PullRequest
0 голосов
/ 12 апреля 2020

У меня есть CSV-файл, который при чтении (я написал код для перемещения и удаления ненужных столбцов.) Выглядит следующим образом:

district = pd.read_csv('train.csv')
column = district.pop('PdDistrict')
district.insert(0, 'PdDistrict', column)
district.drop(['Dates', 'Descript', 'DayOfWeek', 'Resolution', 'Address'], axis=1)
    PdDistrict  Category         X           Y
0   NORTHERN    WARRANTS        -122.425892 37.774599
1   NORTHERN    OTHER OFFENSES  -122.425892 37.774599
2   NORTHERN    OTHER OFFENSES  -122.424363 37.800414
3   NORTHERN    LARCENY/THEFT   -122.426995 37.800873
4   PARK        LARCENY/THEFT   -122.438738 37.771541
5   INGLESIDE   LARCENY/THEFT   -122.403252 37.713431
6   INGLESIDE   VEHICLE THEFT   -122.423327 37.725138
7   BAYVIEW     VEHICLE THEFT   -122.371274 37.727564
8   RICHMOND    LARCENY/THEFT   -122.508194 37.776601
9   CENTRAL     LARCENY/THEFT   -122.419088 37.807802
...

Как использовать код для поиска края / связи между узлами (районами)? Я знаю, что если есть хотя бы одна общая преступная категория между двумя округами, это будет край. Но я не знаю, как написать код, чтобы найти эти ребра (источник, цель, вес, хотя вес может и не понадобиться).

...