Как удалить повторяющиеся значения по годам из набора данных панели, если я применяю условие к определенному году? - PullRequest
0 голосов
/ 29 апреля 2019

У меня есть набор данных панели, который выглядит следующим образом -

CompanyName  Industry  Year   Sales   Assets...
A             Gas      2015   150     900
A             Gas      2016   100     1,000
A             Gas      2017   107     1,500
B             Gas      2015   90      900
B             Gas      2016   100     1,000
B             Gas      2017   99      1,500

Я хотел создать условное подмножество - если объем продаж превышает 100 в 2017 году, то я хочу удалить соответствующую компанию из моей панели по годам.

Я попытался создать условие фильтра и создал набор новых данных, однако я не могу удалить компании по годам.

подмножество (данные, данные $ Год == 2017 и данные $ Продажи> 100)

Я пытаюсь найти способ удалить компании, которые я получаю из вышеуказанного состояния по годам, чтобы создать сбалансированную панель

1 Ответ

0 голосов
/ 29 апреля 2019

Один вариант будет

subset(data, !CompanyName %in% unique(CompanyName[Sales[Year == 2017] > 100]))

Или это можно записать как

subset(data, !CompanyName %in% unique(CompanyName[Year == 2017 & Sales > 100]))
...