У меня есть два кадра данных:
targets = {'index':[3, 4, 5],
'sequence_id':[140366A0464161, 140366A0464178, 140366A0464189],
'target': [0, 1, 0]}
data = {'sequence_id':[140366A0464161, 140366A0464161, 140366A0464161, 140366A0464178, 140366A0464178, 140366A0464178, 140366A0464178, 140366A0464178],
'feature_1' : ['true', 'true', 'false', 'false', 'true', 'true', 'false', 'false']}
Я хочу создать еще один кадр данных, в котором столбцы index
и sequence_id
из targets
соответствуют индексу sequence_id
в data
.
Под этим я подразумеваю, например, третий индекс 140366A0464161
будет false
и цель 0
, например. Индекс не всегда может быть последним экземпляром для каждого sequence_id
. В данных также имеется больше возможностей, чем features_1
.
Мой ожидаемый результат будет:
index sequence_id feature_1 target
0 3 140366A0464161 false 0
1 4 140366A0464178 false 0
2 5 140366A0464189 true 0
С точки зрения того, что я пробовал: я попытался выполнить соединение на основеsequence_id
, но осознайте, что это намного больше, чем индекс, поскольку в data
этот индекс не соответствует действительности, так что это поставило меня в тупик!
Заранее спасибо.