вопрос data.table: как не перезаписать исходный фрейм данных - PullRequest
2 голосов
/ 12 июля 2019

То есть с синтаксисом dplyr, когда я, например, использую mutate, я могу подождать, пока мне понравится результат, и начать свои манипуляции с данными без назначения, и я могу экспериментировать.Но, похоже, с data.table, когда я выполняю операцию, я перезаписываю исходный фрейм данных, и если я передумал, мне придется перезагрузить данные и начать все сначала.Когда я использую канал, я часто запускаю код перед следующим каналом, чтобы проверить, все ли в порядке ...

library(data.table, warn.conflicts = FALSE)
#> Warning: package 'data.table' was built under R version 3.6.1
library(dplyr, warn.conflicts = FALSE)
#> Warning: package 'dplyr' was built under R version 3.6.1
df <- as.data.table(mtcars)

# dplyr version
mtcars %>% 
  as_tibble() %>%  
  mutate(am = 2*am)
#> # A tibble: 32 x 11
#>      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
#>    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#>  1  21       6  160    110  3.9   2.62  16.5     0     2     4     4
#>  2  21       6  160    110  3.9   2.88  17.0     0     2     4     4
#>  3  22.8     4  108     93  3.85  2.32  18.6     1     2     4     1
#>  4  21.4     6  258    110  3.08  3.22  19.4     1     0     3     1
#>  5  18.7     8  360    175  3.15  3.44  17.0     0     0     3     2
#>  6  18.1     6  225    105  2.76  3.46  20.2     1     0     3     1
#>  7  14.3     8  360    245  3.21  3.57  15.8     0     0     3     4
#>  8  24.4     4  147.    62  3.69  3.19  20       1     0     4     2
#>  9  22.8     4  141.    95  3.92  3.15  22.9     1     0     4     2
#> 10  19.2     6  168.   123  3.92  3.44  18.3     1     0     4     4
#> # ... with 22 more rows

# here i will still have my original dataframe mtcars. 

df[, am := 2*am]
head(df)
#>     mpg cyl disp  hp drat    wt  qsec vs am gear carb
#> 1: 21.0   6  160 110 3.90 2.620 16.46  0  2    4    4
#> 2: 21.0   6  160 110 3.90 2.875 17.02  0  2    4    4
#> 3: 22.8   4  108  93 3.85 2.320 18.61  1  2    4    1
#> 4: 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
#> 5: 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
#> 6: 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

df[cyl ==6, am := 2*am]
head(df)
#>     mpg cyl disp  hp drat    wt  qsec vs am gear carb
#> 1: 21.0   6  160 110 3.90 2.620 16.46  0  4    4    4
#> 2: 21.0   6  160 110 3.90 2.875 17.02  0  4    4    4
#> 3: 22.8   4  108  93 3.85 2.320 18.61  1  2    4    1
#> 4: 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
#> 5: 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
#> 6: 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1

Создано в 2019-07-11 пакетом Представить (v0.3.0)

Итак, если я просто хочу добавить фильтр с data.table Я собираюсь умножить am на 2 снова ... вот как data.table работает?Есть ли способ не перезаписать фрейм данных?Или я должен всегда делать копию, когда боюсь ошибиться?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...