То есть с синтаксисом dplyr
, когда я, например, использую mutate
, я могу подождать, пока мне понравится результат, и начать свои манипуляции с данными без назначения, и я могу экспериментировать.Но, похоже, с data.table
, когда я выполняю операцию, я перезаписываю исходный фрейм данных, и если я передумал, мне придется перезагрузить данные и начать все сначала.Когда я использую канал, я часто запускаю код перед следующим каналом, чтобы проверить, все ли в порядке ...
library(data.table, warn.conflicts = FALSE)
#> Warning: package 'data.table' was built under R version 3.6.1
library(dplyr, warn.conflicts = FALSE)
#> Warning: package 'dplyr' was built under R version 3.6.1
df <- as.data.table(mtcars)
# dplyr version
mtcars %>%
as_tibble() %>%
mutate(am = 2*am)
#> # A tibble: 32 x 11
#> mpg cyl disp hp drat wt qsec vs am gear carb
#> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 21 6 160 110 3.9 2.62 16.5 0 2 4 4
#> 2 21 6 160 110 3.9 2.88 17.0 0 2 4 4
#> 3 22.8 4 108 93 3.85 2.32 18.6 1 2 4 1
#> 4 21.4 6 258 110 3.08 3.22 19.4 1 0 3 1
#> 5 18.7 8 360 175 3.15 3.44 17.0 0 0 3 2
#> 6 18.1 6 225 105 2.76 3.46 20.2 1 0 3 1
#> 7 14.3 8 360 245 3.21 3.57 15.8 0 0 3 4
#> 8 24.4 4 147. 62 3.69 3.19 20 1 0 4 2
#> 9 22.8 4 141. 95 3.92 3.15 22.9 1 0 4 2
#> 10 19.2 6 168. 123 3.92 3.44 18.3 1 0 4 4
#> # ... with 22 more rows
# here i will still have my original dataframe mtcars.
df[, am := 2*am]
head(df)
#> mpg cyl disp hp drat wt qsec vs am gear carb
#> 1: 21.0 6 160 110 3.90 2.620 16.46 0 2 4 4
#> 2: 21.0 6 160 110 3.90 2.875 17.02 0 2 4 4
#> 3: 22.8 4 108 93 3.85 2.320 18.61 1 2 4 1
#> 4: 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
#> 5: 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
#> 6: 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
df[cyl ==6, am := 2*am]
head(df)
#> mpg cyl disp hp drat wt qsec vs am gear carb
#> 1: 21.0 6 160 110 3.90 2.620 16.46 0 4 4 4
#> 2: 21.0 6 160 110 3.90 2.875 17.02 0 4 4 4
#> 3: 22.8 4 108 93 3.85 2.320 18.61 1 2 4 1
#> 4: 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
#> 5: 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
#> 6: 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
Создано в 2019-07-11 пакетом Представить (v0.3.0)
Итак, если я просто хочу добавить фильтр с data.table
Я собираюсь умножить am
на 2 снова ... вот как data.table
работает?Есть ли способ не перезаписать фрейм данных?Или я должен всегда делать копию, когда боюсь ошибиться?