Что касается удаления строк, вы можете сделать:
set.seed(2)
df <- data.frame(matrix(sample(c(NA, 1), 1500, replace = T), ncol = 15))
df_sub <- df[rowSums(is.na(df))/ncol(df) <0.75, ]
Что касается пропущенных значений, основной пакет - mice
. В этом пакете есть несколько вариантов, основанных на различных методах в зависимости от вашего типа данных. Кроме того, вы можете использовать пакет missForest
для смешанных данных. Отметьте их для начала.