Методология R: Управление и ввод / вывод между ноутбуком R и большими вычислительными серверами - PullRequest
4 голосов
/ 24 января 2012

Это общий методологический вопрос, касающийся R как средства для:

  • настройка и запуск заданий на удаленных вычислительных платформах для различных интенсивных задач моделирования,
  • затем получает данные с этих удаленных вычислительных серверов, а
  • затем проведите анализ.

R, безусловно, отвечает этой задаче, и я считаю, что это проблема, которую многие другие обдумывали и выполняли, поэтому я надеюсь извлечь уроки из предыдущего опыта.

В настоящее время я использую R вместе с системной командой R для управления Putty программами pscp и Plink для передачи пакетного файла, запуска процесса, ожидания его завершения и затем копирования результатов обратно для обработка.

Признаюсь, это грубо, но работает на удивление хорошо.

Есть ли лучшие способы? Возвращаемые файлы данных могут быть большими.

Я бы хотел определить следующий шаг в постепенной прогрессии, не сходя с ума. Это должно быть просто.

1 Ответ

0 голосов
/ 24 января 2012

На интересующей домашней странице data.table есть (забавное) 8-минутное видео о взаимодействии клиент / сервер, которое может представлять интерес, а может и не интересоваться. Но вы уже что-нибудь рассматривали в HPC Task View ? Это, кажется, не упоминает Rserve, так что посмотри на это тоже, как предложила Ханси.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...