Как ссылаться на другие столбцы при использовании dplyr mutate () - PullRequest
0 голосов
/ 19 января 2020

Простите, если я не отформатировал этот пост должным образом, поскольку он мой первый.

В настоящее время я провожу некоторые исследования винограда и пытаюсь найти способ использовать функцию mutate (). работать так, как мне нужно.

Рассмотрим две таблицы данных: Сходство и Вина .

Вина - это основная таблица, в которой перечислены все информация о винах, такая как вкусовые характеристики, регион и, что более важно, Виноград , которые используются для производства этого вина.

Сходство - это таблица, в которой содержится список винограда, который соответствует некоторым Профиль вкуса. Идея заключается в том, чтобы увидеть, может ли виноград предсказать на основе связанных с ним ароматов.

У него также есть столбец n , который подсчитывает, сколько бутылок этого сорта винограда поделиться тем же профилем вкуса. Например, допустим, у меня есть 2000 бутылок шираза в таблице Wines, но только 300 из этих бутылок имеют тот же профиль вкуса, что и вход, тогда таблица сходства может выглядеть как

Grapes         n
Shiraz/Syrah:  300

, но, очевидно, с большим количеством винограда чем просто Шираз / Сира.

Теперь мне нужно как-то подсчитать, сколько бутылок в Винах - Шираз / Сира, и разделить n на это число, чтобы сбалансировать баллы.

Это строка кода, которую я пытаюсь:

Similarity %>% mutate(n = n / nrow(filter(Wines, Grapes == Similarity$Grapes))

Очевидно, что это работает не так, как я задумал, поэтому я предполагаю, что мой вопрос заключается в том, как получить данные из еще один столбец в функции mutate?

mutate должен работать с каждой строкой индивидуально, так как мне получить доступ к названию винограда, которое соответствует n, на который нацеливается mutate?

Заранее спасибо и, надеюсь, я был достаточно кратким.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...