Я хочу изменить этот код, чтобы я мог назначить каждому из этих модальных глаголов разный вес.Идея состоит в том, чтобы использовать нечто похожее на библиотеку NRC, где у нас есть «цифры» 1-5, представляющие категории, а не числа.
modals<-data_frame(word=c("must", "will", "shall", "should", "may", "can"),
modal=c("5", "4", "4", "3", "2", "1"))
Моя проблема заключается в том, что при запуске следующего кода у меняэто 5 «может» считается таким же, как и «должен».Я хочу, чтобы каждое слово имело различный вес, чтобы, когда я запускаю этот анализ, я мог видеть концентрацию употреблений более сильного «должен» по сравнению с тем, чтобы сказать, что более слабое «может».* с "tidy.DF" - это мой корпус, а "school" и "target" - это имена столбцов.
MODAL<-tidy.DF %>%
inner_join(modals) %>%
count(School, Target, modal, index=wordnumber %/% 50, modal) %>%
spread(modal, n, fill=0)
ggplot(MODAL, aes(index, 5, fill=Target)) +
geom_col(show.legend=FALSE) +
facet_wrap(~Target, ncol=2, scales="free_x")