Привет всем: у меня есть две переменные.Первый называется WITHOUT_VERANDAS.Это список городов, агрегированный по средним ценам аренды домов БЕЗ веранд (около 200 строк):
City Price
1 Appleton 5000
2 Ames 9000
3 Lodi 1020
4 Milwaukee 2010
5 Barstow 2000
6 Chicago 2320
7 Champaign 2000
Вторая переменная называется WITH_VERANDAS.Это список городов, агрегированный по средним ценам аренды домов с верандами (их около 10 строк, это подмножество предыдущего набора данных, поскольку не в каждом городе есть аренда недвижимости с верандами):
City Price
1 Milwaukee 3000
2 Chicago 2050
3 Lodi 5000
Для каждого города в списке WITH_VERANDAS я хочу вычесть значение города WITHOUT_VERANDAS из первого списка.Я хочу увидеть, в каких городах самый высокий или самый низкий дифференциал.По сути, результат должен включать только данные WITH_VERANDAS.
Я пробовал это:
difference <- WITH_VERANDAS$Price-WITHOUT_VERANDAS$Price
View(difference)
Однако, это возвращает столько строк, сколько набор данных WITHOUT_VERANDAS.Я также получаю сообщение об ошибке:
longer object length is not a multiple of shorter object length
И в результате просто вычитаем строку 1 WITHOUT_VERANDAS из строки 1 WITH_VERANDA, как видно из результатов: (например, строка 1 вывода будет значением Милуоки-Аплтон, выходная строка 2 будет Чикаго - Эймс и т. Д.)
1. -2000
2. -6950
Если бы я мог фильтровать только WITHOUT_VERANDAS, чтобы включить только города, включенные в WITH_VERANDAS, я думаю, это сработало бы.Спасибо!