Здравствуйте, у меня есть эти 2 кадра данных
df_1
title URL number date
a /url-1 1 21-02-2020
a /url-1 10 20-02-2020
a /url-1 17 18-02-2020
b /url-2 100 21-02-2020
b /url-2 106 20-02-2020
df_2
URL number date
/url-1 5 21-02-2020
/url-1 12 20-02-2020
/url-1 50 19-02-2020
/url-2 71 17-02-2020
/url-3 9 21-02-2020
/url-3 11 20-02-2020
Поэтому мне нужно выполнить эти Действия , чтобы объединить их в 1 кадр данных:
1) Добавить вызов нового столбца df_2 ["title"] для сопоставления значений df_2 ["URL"] со значениями в df_1 ["title"]
2) Внешнее объединение обоих фреймов данных
3) Агрегирование df_1 ["number"] и df_2 ["number"] по "date" и суммируем их вместе
Вот результат, который я хочу:
new_df
title URL number date
a /url-1 6 21-02-2020
a /url-1 22 20-02-2020
a /url-1 50 19-02-2020
a /url-1 17 18-02-2020
b /url-2 100 21-02-2020
b /url-2 106 20-02-2020
b /url-2 71 17-02-2020
null /url-3 9 21-02-2020
null /url-3 11 20-02-2020
Что нужно отметить:
A) Я не могу просто выполнить внешнее объединение по "URL" и "дате", так как вы можете заметить, что в df_2; строка 3 (19-02-2020) не имеет ту же дату в df_1 для " / URL-1" . Та же проблема относится и к df_2; строка 4 также
B) Я не против пропустить Действие 1 (как выделено выше), если я могу добиться того, что хочу для new_df
Ваша помощь высоко ценится! :)