При запуске заданий с помощью PBSCluster.scale (n), когда по истечении времени ожидания задания автоматически запускаются новые, чтобы занять их место?
Нет, но вы можете попробовать использовать adapt intead
cluster.adapt(minimum_jobs=n, maximum_jobs=n)
Когда задание умирает (например, из-за тайм-аута), перезапускаются ли узлы, на которых выполняется это задание, на другом задании или они теряются?
Они перезапущены. Однако имейте в виду, что если одну и ту же задачу необходимо перезапустить несколько раз, Dask перестанет доверять ей и просто пометит ее как неудачную.