Добавить дублированные строки во фрейм данных - PullRequest
0 голосов
/ 07 июня 2019

У меня есть файл CSV (2,2 млн строк, 6,5 ГБ), в котором мне нужно умножить строки данных в 3/4 раза, поэтому я получаю около 6-10 млн строк.

Первый разчто-нибудь в R, так что R может быть даже не лучшим инструментом для этого (я просто подумал, что это может быть).

На данный момент я смог загрузить данные в фрейм данных, используя:

df <- read.table("MyFilePath", 
              header = TRUE,
              sep = ",")

Куда мне идти отсюда?

1 Ответ

1 голос
/ 07 июня 2019

Простой цикл for и rbind сделают это:

repetitions <- 5
for (i in 1:repetitions) {
  df <- rbind(df, df)
}

Вы можете изменить повторения на любое значение, конечно. Имейте в виду, что он удваивается каждый раз, поэтому вы переходите от 2 до 4 к 8 ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...