Цель здесь - автоматизировать конвейер обработки данных, где я могу читать в файле .csv, запускать скрипт и выводить обработанный файл, готовый для построения графиков данных. Все, что я делаю, это применяю некоторые операции к нескольким столбцам, но мне неясна автоматизация одного шага:
Мне нужно разделить значения в одном столбце на значения в другом, но перед делением мне нужно вычесть значение из указанной ячейки c. Однако в каждом отдельном файле .csv, который определяет c расположение ячейки, будет меняться, поэтому я не могу просто извлечь ячейку столбца / строки в качестве переменной и использовать ее. В качестве примера фрейма данных:
df<-
sampleid t1 t2
a1 4 15
a2 3 18
a3 7 30
b1 6 17
blank 1 5
Функция будет тогда
df <- df %>% mutate(ri=(t1-1)/(t2-1))
Где «1», вычтенное из t1 и t2, происходит из значения «t1» пустой строки , Я хотел бы создать переменную значения этой ячейки, чтобы подставить в это уравнение (иногда это что-то отличное от 1). Указанная строка c во фрейме csv / data будет меняться в зависимости от общего количества выборок, поэтому я не могу каждый раз выбирать фиксированную ячейку.
В идеале это было бы просто
df <- df %>% mutate(ri=(t1-x)/(t2-x))
Где «x» было присвоено этому пустому значению t1 из фрейма данных.
Любые мысли о хорошем способе сделать это? Спасибо.