У меня есть следующая таблица данных под названием «grams2_test_freq»:
str(grams2_test_freq)
Classes ‘data.table’ and 'data.frame': 191026 obs. of 2 variables:
$ term: chr "and_green" "green_acknowledged" "acknowledged_friday" "friday_there" ...
$ c : num 6 1 1 1 69 4 1 7 12 3 ...
- attr(*, ".internal.selfref")=<externalptr>
Где «термин» - это различные N-граммы, а «c» - их частота.
Я хочу создать функцию, которая добавляет столбец в таблицу данных, содержащий вероятность появления каждого «термина» во всей таблице данных, чтобы я мог применить функцию к любой таблице данных, которую я хочу.
Я пробовал приведенный ниже простой код с помощью команды dply MUTATE - он работает, пока функция запущена, но после завершения функции таблица данных, которая находится в среде R, вообще не изменилась (столбец Вероятность не изменился). добавлено):
calc.prob.all.words.in.test.set <- function(test_set) {
test_set <- mutate(test_set, Probability = c /sum(c) )
}
Что я делаю не так?
Спасибо ...!