Данные будут существовать в каждом рабочем процессе dask. У вас будет десять копий на каждом узле.
Работники Dask работают совершенно независимо. Они не знают других работников, которые могут находиться на том же узле.
Вместо этого вы можете рассмотреть возможность создания одного работника dask на каждом узле, который имеет десять потоков. Часто это правильный выбор, особенно если вы имеете дело с большими числовыми данными.