Я новичок в R и пытаюсь понять, могу ли я использовать R более эффективно, чем SQL:
У меня есть два кадра данных
DF1:
Year NAmeE Total_Population Median_Income City
2014 ZCTA5 43001 2475 87333 Alexandria
2014 ZCTA5 43002 2753 83873 Amlin
2014 ZCTA5 43003 2366 46691 Ashley
2014 ZCTA5 43004 24625 70809 Blacklick
2014 ZCTA5 43005 155 43810 Bladensburg
DF2:
Zip Total2014 Total2017 Difference
ZCTA5 43001 2475 2890 -415
ZCTA5 43002 2753 3238 -485
ZCTA5 43003 2366 2895 -529
ZCTA5 43004 24625 25768 -1143
ZCTA5 43005 155 200 -45
Я попытался использовать функцию типа vlookup, потому что я хочу, чтобы город, соответствующий Zip в DF2:
Мой вклад:
> merged_cities <- merge(filterdacsom,df_diff,by.x="NameE",by.y="Zip")
Error in fix.by(by.x, x) : 'by' must specify a uniquely valid column
> merged_cities <- left_join(filterdacsom,df_diff,by = c("NameE"="Zip"))
Error: `by` can't contain join column `NameE` which is missing from LHS
Call `rlang::last_error()` to see a backtrace
Почему я получаю эти ошибки, даже если имя заголовка в обоих кадрах данных имеет уникальное имя, т.е. DF1 - это «NameE», а DF2 - «Zip»