У меня есть набор данных, который выглядит следующим образом:
Country Partner Year Sector Value
1 AUT AUT 2005 A 2132
2 AUT AUT 2005 B 43213
3 AUT AUT 2006 A 2451
4 AUT AUT 2006 B 38723
5 AUT AUS 2005 A 3241
6 AUT AUS 2005 B 24213
7 AUT AUS 2006 A 3728
8 AUT AUS 2006 B 21923
9 AUS AUT 2005 A 723
10 AUS AUT 2005 B 23120
11 AUS AUT 2006 A 953
...
Я хотел бы получить следующие форматы данных):
a) Общий объем производства страны / года/ Сектор, независимо от партнера
Country Year Sector Value
1 AUT 2005 A 231435
2 AUT 2005 B 4512312
3 AUT 2006 A 213451
4 AUT 2006 B 4738723
5 AUS 2005 A 123461
6 AUS 2005 B 3213456
7 AUS 2006 A 162134
...
b) Использование страны / года / сектора внутри страны
Country Partner Year Sector Value
1 AUT AUT 2005 A 2132
2 AUT AUT 2005 B 43213
3 AUT AUT 2006 A 2451
4 AUT AUT 2006 B 38723
5 AUS AUS 2005 A 3241
6 AUS AUS 2005 B 24213
7 AUS AUS 2006 A 2314
...
Существуют и другие форматы данных, которые мне понадобятся, но, как они кажутсяаналогично, я не буду их включать, и они должны оказаться полезным для меня, как только я пойму идею, как добраться до а) и б).
Что касается того, что я уже пробовал - яя новичок, поэтому не так уж много: я пытался играть с tidyr
функциями filter
, group_by
Я также пытался spread
и gather
, которые работали в некоторых подобных случаях, но здесь это не так.
У меня есть подозрение, что какая-то петля может быть полезна здесь, но это еще не моя сила, если не сказать больше.
Спасибо за предложения!