Итак, у меня есть большой набор данных (см. Мой предыдущий вопрос), где мне нужно его поднастроить на основе идентификатора, который есть у меня в другой таблице
Я использую выражение вроде:
vars <- dbListFields(db, "UNIVERSE")
ids <- dbGetQuery(db, "SELECT ID FROM LIST1"
dbGetQuery(db,
paste("CREATE TABLE SUB1 (",
paste(vars,collapse=" int,"),
")"
) )
dbGetQuery(db,
paste("INSERT INTO SUB1 (",
paste(vars,collapse=","),
") SELECT * FROM UNIVERSE WHERE
UNIVERSE.ID IN (",
paste(t(ids),collapse=","),
")"
) )
Код выполняется (возможно, я пропустил скобки выше), но это занимает некоторое время, так как размер моей таблицы UNIVERSE составляет около 10 гигабайт.Основная проблема в том, что мне придется запустить это для многих разных таблиц "LIST #", чтобы сделать "SUB #", и подмножества не пересекаются, поэтому я не могу просто удалить запись из UNIVERSE, когда я закончу сэто.
Мне интересно, если я пошел на подмножество неправильно или есть другие способы, которыми я могу ускорить это?
Спасибо за помощь.