Это общий методологический вопрос, касающийся R как средства для:
- настройка и запуск заданий на удаленных вычислительных платформах для различных интенсивных задач моделирования,
- затем получает данные с этих удаленных вычислительных серверов, а
- затем проведите анализ.
R, безусловно, отвечает этой задаче, и я считаю, что это проблема, которую многие другие обдумывали и выполняли, поэтому я надеюсь извлечь уроки из предыдущего опыта.
В настоящее время я использую R вместе с системной командой R для управления Putty
программами pscp
и Plink
для передачи пакетного файла, запуска процесса, ожидания его завершения и затем копирования результатов обратно для обработка.
Признаюсь, это грубо, но работает на удивление хорошо.
Есть ли лучшие способы? Возвращаемые файлы данных могут быть большими.
Я бы хотел определить следующий шаг в постепенной прогрессии, не сходя с ума. Это должно быть просто.