Как создать перформативный логический вектор для большого фрейма данных R Language? - PullRequest
0 голосов
/ 16 декабря 2018

Я прошу помощи по следующему: CSV-файл: 7,5 ГБ с 185 миллионами строк.

До сих пор я сделал следующее:

library(caTools)
library(data.table)
library(dplyr)

dados_treino <- fread('train.csv')

vetor_TF  <- sample.split(dados_treino, SplitRatio = 0.70)

На данный момент,R Studio возвращает ошибку:

Невозможно выделить вектор размером 7,5 ГБ

Цель состоит в том, чтобы разбить объект на обучающие и тестовые данные.

Iобратиться за помощью: 1) в состоянии использовать пример команды (это может быть пакет, отличный от CATOOLS);2) применить вектор, построенный в двух наборах данных

Перейдите по ссылке на данные: загрузить данные

Я использую компьютер с 16 ГБ оперативной памяти и Intelпроцессор i7

...