Как добавить переменную с mutate для выбранных строк с фиксированным интервалом - PullRequest
1 голос
/ 08 мая 2019

У меня большой набор данных, который содержит текст со многими связанными значениями.Текст распределяется по 1 слову в строке.Каждое слово имеет идентификатор, который определяет его положение в тексте.Я хочу добавить переменную под названием «Линия», где я добавляю значение к каждые 10 слов, так что первые десять (1:10) будет иметь Line = 1, 11-20 будет Line = 2 и т. Д.,Это действительно длинный текст, поэтому я не хочу вручную писать функцию изменения для каждых десяти слов.Какие-либо предложения?Спасибо!

Вот как выглядят заинтересованные переменные

structure(list(IA_LABEL = c("it", "is", "a", "triumph", "said", 
"mr", "bankes", "laying", "his", "knife", "down", "for", "a", 
"moment", "he", "had", "eaten", "attentively", "it", "is", "rich", 
"it", "is", "tender", "it", "is", "perfectly", "cooked", "he", 
"thought"), Item_ID = 1:30), class = c("tbl_df", "tbl", "data.frame"
), row.names = c(NA, -30L))

1 Ответ

2 голосов
/ 08 мая 2019

Можно использовать gl при создании индикатора группировки

library(dplyr)
df1 %>% 
   mutate(Line = as.integer(gl(n(), 10, n())))

Или использовать %/%

df1 %>%
    mutate(Line = (row_number() - 1) %/% 10 + 1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...