Goncalo Peres 09 июля 2019 15

Разбить файл набора данных на части определенного размера

1 Ответ

Goncalo Peres / 16 июля 2019

Проблема решена в R.

Прочитать набор данных.
Разделить набор данных на 14 кусков (в 13 кусках у меня был файл размером более 100 МБ).
Затем я сохранил результат обратно как CSV, используя purrr

Здесь идет сценарий:

trade = read.csv("commodity_trade_statistics_data.csv")

no_of_chunks <- 14

f <- ceiling(1:nrow(trade) / nrow(trade) * 14)

res <- split(trade, f)

library(purrr)
map2(res, paste0("chunk_", names(res), ".csv"), write.csv)

...