Просто создайте индексы, которые будут разделять ваши исходные функции и цели и применять их каждый раз, когда вам понадобится набор данных с загрузочной привязкой.
Вот пример реализации с использованием набора данных sklearn boston:
import numpy as np
from sklearn.datasets import load_boston
def get_bootstrap_indices(dataset, datasets: int):
for _ in range(datasets):
yield np.random.choice(np.arange(len(dataset)), size=len(dataset), replace=True)
dataset = load_boston().data
print(f"Original dataset shape: {dataset.shape}")
for indices in get_bootstrap_indices(dataset, 10):
print(dataset[indices].shape)