R: программно читать очень большие данные небольшими частями - PullRequest
0 голосов
/ 24 октября 2018

У меня есть очень большой файл данных (my_file.dat), содержащий 31191984 строк нескольких переменных.Я хотел бы программно импортировать этот набор данных в R небольшими частями, например, фреймами данных по 1 миллиону строк.По этой ссылке предлагается использовать read.table() с опцией nrows.Он работает для первого раунда из 1 миллиона строк с помощью этой команды:

  my_data <- read.table("path_to_my_file.dat", nrows = 1e+06)

Как автоматизировать эту процедуру для следующих раундов по 1 миллиону строк, пока все части не будут импортированы в виде фреймов данных R?Мне известно, что одним из вариантов может быть сохранение данных в базе данных SQL и разрешение R на SQL.Однако я ищу только R конкретное решение.

1 Ответ

0 голосов
/ 24 октября 2018

Вы можете использовать skip:

for(i in 1:n){
read.table("file.txt",skip=i*1e+06 ,nrows=1e+06 )
}

Как уже упоминалось, например, здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...