Я создал матрицу прогнозирования для большого набора данных следующим образом:
library(mice)
dfpredm <- quickpred(df, mincor=.3)
A B C D E F G H I J
A 0 1 1 1 0 1 0 1 1 0
B 1 0 0 0 1 0 1 0 0 1
C 0 0 0 1 1 0 0 0 0 0
D 1 0 1 0 0 1 0 1 0 1
E 0 1 0 1 0 1 1 0 1 0
**F 0 0 1 0 0 0 1 0 0 0**
G 0 1 0 1 0 0 0 0 0 0
H 1 0 1 0 0 1 0 0 0 1
I 0 1 0 1 1 0 1 0 0 0
J 1 0 1 0 0 1 0 1 0 0
Я хотел бы создать подмножество исходного df на основе dfpredm
.
Подробнеев частности, я хотел бы сделать следующее:
Давайте предположим, что моя зависимая переменная F
.Согласно матрице прогнозирования F соотносится с C и G. Кроме того, C и G лучше всего прогнозируются по D, E и B, D. соответственно.
Идея заключается в создании подмножества df
на основе зависимой переменной F, для которой в строке F
значение равно 1.
Fpredictors <- df[,(dfpredm["F",]) == 1]
Но также сделайте то же самое для переменных, где строки в F
равны 1. Я думаюсначала получить имена столбцов следующим образом:
Fpredcol <-colnames(dfpredm[,(dfpredm["c241",]) == 1])
И затем сделать for loop
с этими именами столбцов?
Для конкретного примера я хотел бы получить подмножество.
dfsub <- df[,c("F","C","G","B","E","D")]
Я бы хотел автоматизировать этот процесс.Может ли кто-нибудь показать мне, как это сделать?