Сначала я хочу сделать выборку в наборе данных, используя упаковку. После этого я буду использовать алгоритм обратного распространения для обучения и тестирования. Предположим, я выберу случайным образом 40% данных из набора данных, чтобы создать 1 набор выборок. После этого я снова возьму 40% данных из общего набора данных и создам другой набор данных.
Код для выборки:
def subsample(dataset, ratio):
sample = list()
n_sample = round(len(dataset) * ratio)
while len(sample) < n_sample:
index = randrange(len(dataset))
append(dataset[index])
print(sample)
return sample
Набор данных: (Я сделаю выборку на 20 наборах данных из UCI Machine Repository)
import pandas as pd
dataset =pd.read_csv("abalone.csv")