У меня есть большой фрейм данных (более 10 000 000 строк), который я хотел бы обработать. Я также довольно плохо знаком с R и хочу лучше понять, как работать с такими большими наборами данных.
У меня есть формула, которую я хочу применить к каждой строке в фрейме данных. Но из опыта я обнаружил, что «для циклов» и «применять» не очень хорошо работают с действительно большими наборами данных. Я пытался обернуть голову вокруг Split-Apply-Combine, но я не совсем понимаю, как его использовать, когда я хочу применить функцию построчно.
Вот пример dataframe это имеет 1 000 000 строк. Я хотел бы применить функцию, которая берет каждую строку и выполняет простое умножение на два столбца, чтобы получить вывод (я понимаю, что мог бы сделать это намного проще, но я хочу попрактиковаться в Split-Apply-Combine).
#make a dataframe
df <- data.frame("a"=c(rep("group1",times=500000),rep("group2",times=500000)),
"b"=c(1:1000000),"c"=c(1000001:2000000))
Что я хочу сделать: для каждой строки я хочу взять значение в столбце "b" и умножить его на значение в столбце "c"