У меня есть два кадра данных двух разных транскрипций одних и тех же записей, каждый имеет два столбца, один - слова, а другой - временные коды. Я хочу объединить их, чтобы узнать, какие слова одного информационного кадра находятся в другом, и сравнить их временные коды. Проблема в том, что есть значения, которые появляются более одного раза, что портит порядок r aws. Например:
enter code here
a = {'word':['one','three','two','three'],
'time': ['1.2','3.4','5.6','6.7']}
b = {'word':['one','three','three'],
'time': ['1.6','4','5.8']}
df1= pd.DataFrame(a)
df2= pd.DataFrame(b)
c = df1.merge(df2, on = ['word'])
что я получаю вот что:
word time_x time_y
0 one 1.2 1.6
1 three 3.4 4
2 three 3.4 5.8
3 three 6.7 4
4 three 6.7 5.8
мне нужно найти способ избежать r aws 2 и 3. Есть ли у кого-нибудь решение