У меня есть фрейм данных со следующей структурой
Sentence Label
A B
"unique ID1" 0 "Sample sentence 1" jt
"unique ID1" 1 "Sample sentence 2" jt
"unique ID3" 2 "Sample sentence 3" edu
"unique ID3" 3 "Sample sentence 4" edu
Я хочу иметь возможность получить все значения индекса B
, сгруппированные по значению индекса A
, где label == jt
, и повторить это длявсе уникальные значения меток. Предпочтительный тип возврата - key-value
пар, но любой другой подходящий формат также будет работать.
Допустимый пример для метки == jt:
("unique ID1" : [0,1] )
Допустимый пример дляlabel == edu:
("unique ID3" : [2,3] )
Я уже пробовал много SO
вопросов, но не нашел именно то, что ищу.
Я такжепопробовал это:
sorted_index_df = df.sort_index(inplace = False)
multi_index = sorted_index_df.loc[sorted_index_df["label"] == "jt"].index
Выполнение этого вернуло бы каждое значение индекса A
с соответствующим значением индекса B
в виде отдельного кортежа.
Пример: ('Labor_&_Delivery_Nurse-APRN__Lidia_Lambert__', 17)
Но я хочу иметь возможность группировать все значения индекса B
по значениям из индекса A
.
Любая помощь приветствуется.