Объединить два кадра данных в двух столбцах - PullRequest
0 голосов
/ 28 мая 2018

У меня есть 2 кадра данных:

dfBB

Ранг, Песня, Исполнитель, Год

и dfMap

Artist, Song, SongId, ArtistId

Я хотел бы объединить их на основе Artist и Song, т. Е. Где они совпадают, я добавляю дополнительные столбцы, в противном случае 0:

Artist, Song, SongId, ArtistId, Rank, Year

Я предвижу другую проблему, когда исполнитель или песня могут быть написаны неправильно.Может быть, я могу проверить сходство?Не слишком уверен, как это сделать.

Для объединения я попытался:

merged = pd.merge(dfMap, dfBB, on='Artist' and 'Song', how='outer')

, но получил:

Artist_x, Song, SongId, ArtistId, Rank, Artist_y, Rank 

1 Ответ

0 голосов
/ 28 мая 2018
merged = pd.merge(dfMap, dfBB, on=['Artist','Song'], how='outer')

Вы можете использовать список или массив значений для объединения двух фреймов данных.Я бы порекомендовал проверить документацию

Что касается орфографических ошибок, вам нужно будет выполнить некоторую уборку самостоятельно.Вы можете проверить difflib

...