Генератору псевдослучайных чисел (PRNG) требуется начальное значение по умолчанию, которое можно установить с помощью set.seed()
. Если нет данных, то обычно требуется компьютерная информация. Это может быть время, температура процессора или что-то подобное. Если вы хотите более случайное начальное значение, можно использовать физические значения, такие как белый шум или ядерный распад, но вам обычно нужен внешний источник информации для такого рода случайной информации.
В документации упоминается, что R использует текущее время и идентификатор процесса:
Изначально семян нет; новый создается из текущего времени и идентификатора процесса, когда он требуется. Следовательно, разные сеансы будут давать разные результаты моделирования по умолчанию. Однако начальное число может быть восстановлено из предыдущего сеанса, если восстановлено ранее сохраненное рабочее пространство.
Семя по умолчанию - плохая идея, поскольку случайные генераторы всегда будут производить одинаковые выборки чисел по умолчанию. Если вы всегда берете одно и то же семя, оно больше не рандомизируется, поскольку всегда будут одни и те же числа. Таким образом, вы просто предоставляете фиксированную выборку данных, которая не предназначена для вывода PRNG. Конечно, вы можете отключить начальное значение по умолчанию (если оно будет), но предполагаемая функция является основной для генерации совершенно случайного набора данных, а не фиксированного.
Для статистических подходов это важно с точки зрения валидации и верификации, но становится все более важным, когда вы переходите к криптографии. Есть хороший обязательный ГПС.
Для получения дополнительной информации я рекомендую документацию в случайном порядке.