Простите, если я не отформатировал этот пост должным образом, поскольку он мой первый.
В настоящее время я провожу некоторые исследования винограда и пытаюсь найти способ использовать функцию mutate (). работать так, как мне нужно.
Рассмотрим две таблицы данных: Сходство и Вина .
Вина - это основная таблица, в которой перечислены все информация о винах, такая как вкусовые характеристики, регион и, что более важно, Виноград , которые используются для производства этого вина.
Сходство - это таблица, в которой содержится список винограда, который соответствует некоторым Профиль вкуса. Идея заключается в том, чтобы увидеть, может ли виноград предсказать на основе связанных с ним ароматов.
У него также есть столбец n , который подсчитывает, сколько бутылок этого сорта винограда поделиться тем же профилем вкуса. Например, допустим, у меня есть 2000 бутылок шираза в таблице Wines, но только 300 из этих бутылок имеют тот же профиль вкуса, что и вход, тогда таблица сходства может выглядеть как
Grapes n
Shiraz/Syrah: 300
, но, очевидно, с большим количеством винограда чем просто Шираз / Сира.
Теперь мне нужно как-то подсчитать, сколько бутылок в Винах - Шираз / Сира, и разделить n на это число, чтобы сбалансировать баллы.
Это строка кода, которую я пытаюсь:
Similarity %>% mutate(n = n / nrow(filter(Wines, Grapes == Similarity$Grapes))
Очевидно, что это работает не так, как я задумал, поэтому я предполагаю, что мой вопрос заключается в том, как получить данные из еще один столбец в функции mutate?
mutate должен работать с каждой строкой индивидуально, так как мне получить доступ к названию винограда, которое соответствует n, на который нацеливается mutate?
Заранее спасибо и, надеюсь, я был достаточно кратким.