Сумма строк, которые разделяют все наблюдения, кроме двух, в одном и том же кадре данных - PullRequest
3 голосов
/ 20 сентября 2019

В моем фрейме данных, см. Таблицу, прикрепленную здесь, у меня есть три столбца: страна, результаты и евроскептик.

Я хотел бы знать, возможно ли объединить строки, которые разделяют все наблюдения, кроме двух, чтодолжны быть результаты и евроскептические наблюдения.

Например, функция, которая оставила бы меня с двумя строками для Бельгии.Тот, в котором значение евроскептика равно 1, а другое - где 0. Тогда столбец результатов в каждой из этих строк будет суммой, образованной результатами предыдущих строк, которые совместно используют 1 или 0 для переменной евроскептика.

Таким образом, в строке Eurocecetic = 0 в Бельгии результаты наблюдений будут равны сумме результатов наблюдений за строками в моей текущей таблице, которые были связаны с Бельгией, и все они имели значение евроскептика как 0.

Короче говоря, преобразование моей df в одну с двумя строками на страну, евроскептическое значение равно 0 и 1, где наблюдение за результатами для каждого представляет собой суммированные результаты наблюдений предыдущих строк с соответствующими значениями страны и евроскептика.

Возможно ли это?

Заранее благодарен за помощь!

Моя таблица в том виде, в каком она есть сейчас

1 Ответ

1 голос
/ 20 сентября 2019

Мы можем сгруппировать по «Странам», «euroceptic» получит sum «результатов»

library(dplyr)
 df1 %>%       
     group_by(Country, eurosceptic) %>%         
     summarise(results = sum(results))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...