В качестве исследовательского проекта для программы старшекурсников я выполняю очень простой анализ данных (на самом деле, всего лишь слово).
Я собираюсь использовать Amazon Elastic MapReduce.
Iнужно загрузить 4ГБ .xml файл.
Каков наилучший способ сделать это?
Загрузить небольшие ZIP-файлы и каким-то образом разархивировать их в корзину?Или разделить файл, загрузить и затем использовать все небольшие файлы для потоковой передачи задания MapReduce?
Спасибо