Я хочу объединить два фрейма данных с неравной длиной с некоторыми условиями. Детали фреймов данных:
- Фрейм данных A содержит около 1000 строк
- Фрейм данных B содержит около 50 строк
Поля в обоих фреймах данных похожи
в A:
A_Name, A_count, A_Normalised value, A_year
кадр данных A:
print (df1)
A_Organisation A_count A_Normalised A_Year
0 ABC 654 34545 2018
1 DEF 565 54564 2018
2 GHI 565 34546 2018
3 QWE 790 3945 2018
4 DSO 788 1561 2017
5 DFB 34579 546 2017
6 HHS 56 31651 2017
7 FDGH 98 156 2016
8 DSFH 51651 153156 2016
9 KBIU 151 1561 2015
10 SDF 165 6513 2015
Для кадра данных B:
B_Name, B_count, B_Normalised value, B_year
print (df2)
B_Organisation B_count B_Normalised B_Year
0 MNO 123 432 2018
1 MNO 133 234 2018
2 MNO 8743 484 2017
3 MNO 1335 1512 2015
4 MNO 456 3454 2014
5 MNO 345 234 2014
Теперь я хочу объединить оба фрейма данных на основе года, но я не хочу дублировать значения.
то есть, если в Dataframe A, скажем, для 2018 года, содержится 50 значений, а в Dataframe B для 2018 года содержится 5 значений. Тогда общее количество строк в 2018 году должно быть 50, а результат должен быть таким:
