Объединение панелей данных панд с одинаковыми столбцами - PullRequest
0 голосов
/ 18 сентября 2018

Я пытаюсь объединить два фрейма данных, один из которых содержит информацию о коэффициентах выигрыша для скачек, а другой - о коэффициентах места.Они имеют одни и те же имена столбцов.В настоящее время я получаю дубликаты на имена лошадей с вероятностями, которые я не узнаю.Я думаю, что проблема возникает из-за того, что у некоторых рас нет места на рынке, только на выигрышном рынке, поэтому это сбивает с толку.Ниже приведен пример таблицы выигрышей слева, место справа.

Time   Horse      Odds   Result     Time   Horse      Odds_P Result_P     
13:55  Go faster  5.0    1          13:55  Go faster  5.0    1
14:10  Slow down  4.0    0

Я хочу просто иметь возможность добавить Odds_P и Result_P для более быстрого перехода к концу кадра данных выигрыша.и отбросьте запись, у которой нет соответствующего Place market.

Я попробовал concat, join и merge, все из которых представляют мне некоторые дубликаты имен лошадей, с шансами, которые я не узнаю.

Любая помощь будет принята с благодарностью

1 Ответ

0 голосов
/ 18 сентября 2018

Если я правильно вас понимаю, ваш фрейм данных odds_p выглядит следующим образом:

    Time      Horse  Odds  Result
0  13.55  Go faster   5.0       1
1  14:10  Slow down   4.0       0

И result_p выглядит так:

    Time      Horse  Odds_P  Result_P
0  13.55  Go faster     5.0         1

Я переименую последние два столбца из фрейма данных odds_p в Odds_Pи Result_P:

odds_p.rename(columns = {'Odds':'Odds_P', 'Result':'Result_P'}, inplace = True)

А теперь объедините оба, используя ПРАВОЕ соединение:

final_p = pd.merge(odds_p, result_p, on = ['Time', 'Horse', 'Odds_P', 'Result_P'], how = 'right')

Ваш конечный результат будет выглядеть так:

    Time      Horse  Odds_P  Result_P
0  13.55  Go faster     5.0         1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...