Использование номеров столбцов в dplyr через - PullRequest
1 голос
/ 01 августа 2020
library(tidyverse, warn.conflicts = TRUE)
#> Warning: package 'tidyverse' was built under R version 3.6.3
#> Warning: package 'ggplot2' was built under R version 3.6.3
#> Warning: package 'tidyr' was built under R version 3.6.3
#> Warning: package 'purrr' was built under R version 3.6.3
#> Warning: package 'dplyr' was built under R version 3.6.3
#> Warning: package 'stringr' was built under R version 3.6.3
#> Warning: package 'forcats' was built under R version 3.6.3
df <- tibble(x = 1:10, y = 11:20, z = rep(1:2, each = 5),a = runif(10))
df %>% mutate(across(c(x, a), ~ .x / y))
#> # A tibble: 10 x 4
#>         x     y     z      a
#>     <dbl> <int> <int>  <dbl>
#>  1 0.0909    11     1 0.0885
#>  2 0.167     12     1 0.0464
#>  3 0.231     13     1 0.0586
#>  4 0.286     14     1 0.0590
#>  5 0.333     15     1 0.0111
#>  6 0.375     16     2 0.0595
#>  7 0.412     17     2 0.0320
#>  8 0.444     18     2 0.0311
#>  9 0.474     19     2 0.0386
#> 10 0.5       20     2 0.0236

Создано 01.08.2020 с помощью пакета REPEX (v0.3.0)

Из приведенного выше примера я хотел бы разделить столбцы x и a по y по строкам. Предлагаемый метод находится на этой странице Щелкните здесь Но я должен использовать имена столбцов в качестве аргумента во всех функциях. Можно ли использовать номера столбцов вместо их имен? Буду признателен, если смогу использовать этот трюк для всех экземпляров по горизонтали.

Ответы [ 2 ]

1 голос
/ 01 августа 2020

Мы можем заменить имя без кавычек индексом столбца

library(dplyr)
df %>%
      mutate(across(c(1, 4), ~ .x / y))
# A tibble: 10 x 4
#        x     y     z        a
#    <dbl> <int> <int>    <dbl>
# 1 0.0909    11     1 0.0470  
# 2 0.167     12     1 0.000267
# 3 0.231     13     1 0.0453  
# 4 0.286     14     1 0.0327  
# 5 0.333     15     1 0.0382  
# 6 0.375     16     2 0.0453  
# 7 0.412     17     2 0.0105  
# 8 0.444     18     2 0.0329  
# 9 0.474     19     2 0.0396  
#10 0.5       20     2 0.0249  
0 голосов
/ 01 августа 2020

Мы можем использовать имена столбцов

df2 <- df %>% 
  rowwise() %>% 
  mutate(across(c(x,a), ~ .x/y))
df2
# A tibble: 10 x 4
# Rowwise: 
#   x     y     z         a
# <dbl> <int> <int>     <dbl>
# 1 0.0909    11     1 0.0889   
# 2 0.167     12     1 0.0751   
# 3 0.231     13     1 0.0634   
# 4 0.286     14     1 0.0626   
# 5 0.333     15     1 0.0122   
# 6 0.375     16     2 0.0147   
# 7 0.412     17     2 0.00868  
# 8 0.444     18     2 0.0000776
# 9 0.474     19     2 0.0349   
# 10 0.5      20     2 0.00526  
...