Является ли вычисление с использованием R-Portable менее воспроизводимым, чем использование Контейнера? - PullRequest
1 голос
/ 14 апреля 2020

Я исследую способы для моей группы улучшить воспроизводимость наших анализов. Цель состоит в том, чтобы рецензенты или мы через 10 лет смогли пересчитать наши результаты.

Мой первый выбор - контейнеры, использующие Singularity, которые в основном представляют собой SquashFS со всеми необходимыми файлами, кроме ядра Linux. Но кроме нашего кластера мы работаем на Windows машинах. Наши ИТ не чувствуют себя способными поддерживать Linux ВМ на каждой машине, и при этом я не ожидаю, что мои коллеги-биологи будут надежно продолжать работать внутри контейнера внутри ВМ, а не обходить систему, потому что крайний срок всегда приближается.

Поэтому моя следующая лучшая идея - скопировать R Portable внутри каждого проекта и использовать renv для хранения выделенной библиотеки пакетов R для каждого проекта. Кроме того, я установлю язык, используя Sys.setlocale в .Rprofile проекта. Рабочий каталог может быть установлен в папку проекта (необязательно, чтобы R загружал .Rprofile и пользователи не испытывали искушения использовать абсолютные пути) с помощью , используя относительные пути в Windows Ярлыки

Размер загружаемого файла R Portable составляет 200 МБ, тогда как, например, изображение rocker / r-ver docker составляет 260 МБ. Похоже, что в вычислительной среде, по крайней мере, примерно столько же информации доступно. Позволяет ли эта настройка воспроизвести наши анализы на других Windows машинах?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...