Я прошу помощи по следующему: CSV-файл: 7,5 ГБ с 185 миллионами строк.
До сих пор я сделал следующее:
library(caTools)
library(data.table)
library(dplyr)
dados_treino <- fread('train.csv')
vetor_TF <- sample.split(dados_treino, SplitRatio = 0.70)
На данный момент,R Studio возвращает ошибку:
Невозможно выделить вектор размером 7,5 ГБ
Цель состоит в том, чтобы разбить объект на обучающие и тестовые данные.
Iобратиться за помощью: 1) в состоянии использовать пример команды (это может быть пакет, отличный от CATOOLS);2) применить вектор, построенный в двух наборах данных
Перейдите по ссылке на данные: загрузить данные
Я использую компьютер с 16 ГБ оперативной памяти и Intelпроцессор i7