Записи ссылок Python, если они совпадают в столбце - PullRequest
1 голос
/ 15 мая 2019

У меня есть следующий фрейм данных:

 df=pd.DataFrame({'cluster':[1,1,1,2,8],'ssn':['123','','','567','123']})

Я хочу связать записи с соответствующими ssns. В этом случае я хочу связать кластеры 1 и 8. Ожидаемый результат такой, как показано ниже:

   cluster  ssn
0       1   123
1       1   
2       1   
3       2   567
4       1   123

Я изо всех сил пытаюсь даже определить метод, чтобы приблизиться к этому (то есть я должен использовать сводную таблицу, groupby). Поэтому, даже если я получу какое-либо указание или предложение о том, как мне подойти к этому сценарию, я буду работать над ним.

1 Ответ

2 голосов
/ 15 мая 2019

Использование pandas.DataFrame.groupby.transform:

df['cluster'] = df.groupby('ssn').transform(min)

Выход:

   cluster  ssn
0        1  123
1        1     
2        1     
3        2  567
4        1  123
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...