У меня есть 2 фрейма данных data2 и data3:
data0 = {
'state': ['CA', 'CA', 'OH'],
'year': [2012, 2014, 2010],
's': [2000, 4000, 5000]
}
data1=pd.DataFrame(data0)
data2 = {
'state': ['CA', 'CA', 'OH'],
'year': [2012, 2014, 2010],
's': [2000, 4000, None]
}
data3=pd.DataFrame(data2)
Сначала я хочу посчитать s по штатам и годам:
data11 = data1.groupby(['state', 'year'])['s'].agg({'result1': 'count'})
data33 = data3.groupby(['state', 'year'])['s'].agg({'result2': 'count'})
Вопрос в том, как написать оператор, который
i) если каждый счетчик строк (столбец result1) в data11 равен каждому счетчику строк (result2) в data33, выведите «все строки совпадают» (здесь не отображаются совпадающие строки)
ii) иначе выведите «следующие строки не удалось» (и показывает строки, которые не были выполнены как в data11, так и в data33)
Спасибо!