Позвольте мне перейти к вашей проблеме, предположив, что вам нужно создать набор данных из 2 столбцов и 2 столбцов: 1. 'year' и 2. 'name' okay
1. мы сначала переименуем все неправильные имена Я надеюсь, что вы знаете все неправильные имена из all_batting_statistics_df
, используя это
all_batting_statistics_df.replace(regex=r'^Glen.$', value='Glenn Davis')
, как только вы исправили все написанные слова, выберите меньшее с именами, которые вы знаете, так что это не займет много времени
2. нам нужно, чтобы оба набора данных имели одинаковые столбцы, т. е. только «год» и «имя» . Используйте это, чтобы отбросить ненужные нам столбцы
all_batsman_df_1 = all_batsman_df.drop(['team','pos','salary'])
all_batting_statistics_df_1 = all_batting_statistics_df.drop(['Rk','Name','Age','Tm','Lg','G','PA','AB','R','Summary'], axis=1)
Я не вижу все 31 столбца, поэтому я оставил их, вы должны добавить к приведенному выше коду
3. нам нужно изменить имена столбцов, чтобы они выглядели одинаково, то есть «год» и «имя» , используя python переименование фрейма данных
df_new_1 = all_batting_statistics_df(colums={'Year': 'year', 'Name':'name'})
4. затем, чтобы объединить их
мы будем использовать это
all_batsman_df.merge(df_new_1, left_on='year', right_on='name')
ЗАКЛЮЧИТЕЛЬНЫЕ МЫСЛИ: Если вы не хочу делать все это, найдите способ экспортировать набор данных в листы Google или в Microsoft Excel и использовать их для редактирования с этим передовым программным обеспечением, если вам нравится pandas
, то это не так сложно, вы найдете способ, все лучший!