Предполагая, что у вас есть полный набор данных (назовем его states
) в R в качестве фрейма данных, вы можете либо создать отдельное его подмножество, либо просто удалить из него все состояния, кроме NY
.
Подмножество:
ny <- states[states$state == "NY", ]
Вы создаете новый фрейм данных (ny
) для работы с ним.
Удалите все состояния, кроме NY:
states <- states[states$state == "NY", ]
Разница в том, что вы просто перезаписываете свой исходный фрейм данных измененным.
Если вам не нужны другие штаты, кроме Нью-Йорка, то было бы лучше - с точки зрения памяти - перезаписатьисходный фрейм данных, если вы затем намереваетесь каким-либо образом манипулировать им.
Например, изменение значений и / или структуры фрейма данных займет больше памяти, потому что фреймы данных, которые совместно используют идентичные данные (т.е. неизмененныеподмножества) просто указывают на одну и ту же копию данных в том смысле, что они существуют в одном секторе памяти, и исходный фрейм данных и фрейм данных поднабора указывают на него (исходный объект указываетдля всего набора данных подмножество указывает только на его части, тем самым экономя память (при условии, что оно не изменено)).
Только когда вы изменяете указанное подмножество, создается отдельная копия,таким образом, занимая больше места.
Если, однако, вы подозреваете, что вам понадобится изменить другие данные о состоянии в будущем, я рекомендую создать подмножество и работать с ним, используя его в качестве источника.