У меня есть данные временных рядов, которые не монотонно увеличиваются, поэтому вопрос сортировки / перемешивания исключен.
Я хочу произвольно вытащить n% данных, сохраняя их относительный порядок, в качестве набора для проверки или проверки, который можно отобразить как:
my_ndarray = [ 1, 20, 10, 3, 90, 5, 80, 50, 4, 1] # (number of samples = 1645, number of timesteps = 10, number of features = 7)
# custom_train_test_split()
train = [1, 20, 90, 5, 50, 4, 1]
valid = [10, 3, 80]
Буду признателен некоторые рекомендации о том, как сделать это эффективно. Насколько я понимаю, итерация в стиле Java неэффективна в Python. Я подозреваю, что трехмерная логическая таблица mask будет питоном c и векторизованным способом.