Как сохранить порядок и избежать дубликатов с pandas слиянием? - PullRequest
0 голосов
/ 16 марта 2020

У меня есть два кадра данных двух разных транскрипций одних и тех же записей, каждый имеет два столбца, один - слова, а другой - временные коды. Я хочу объединить их, чтобы узнать, какие слова одного информационного кадра находятся в другом, и сравнить их временные коды. Проблема в том, что есть значения, которые появляются более одного раза, что портит порядок r aws. Например:

enter code here

    a = {'word':['one','three','two','three'],
    'time': ['1.2','3.4','5.6','6.7']}
    b = {'word':['one','three','three'],
    'time': ['1.6','4','5.8']}

    df1= pd.DataFrame(a)
    df2= pd.DataFrame(b)
    c = df1.merge(df2, on = ['word'])

что я получаю вот что:

word time_x time_y
0    one    1.2    1.6
1  three    3.4      4
2  three    3.4    5.8
3  three    6.7      4
4  three    6.7    5.8

мне нужно найти способ избежать r aws 2 и 3. Есть ли у кого-нибудь решение

...