У меня есть много CSV-файлов, в том числе данные из моделирования, которое я делаю. Я передаю их в алгоритм глубокого обучения, помещая все выходные файлы моделирования csv в виде путей к файлам в другой отдельный файл csv. Однако мне нужны два CSV-файла, один из которых содержит 20% путей к выходным CSV-файлам, а другой - остальные 80%. У меня есть алгоритм, чтобы сделать это, но он не рандомизирован;
with open('C:\\train.csv', 'w') as outf:
print('x:data,y:label', file=outf)
for i in range(80):
print('./1/a_%s.csv, 1' % (i + 21), file=outf)
with open('C:\\test.csv', 'w') as outf:
print('x:data,y:label', file=outf)
for i in range(20):
print('./1/a_%s.csv, 1' % (i + 1), file=outf)
Когда я делаю это таким образом, я получаю файлы 1-20 в одном из файлов CSV и от 21 до 100 в другом. Однако я хочу, чтобы они были рандомизированы. так что, может быть, если у меня всего 10 сэмплов, 3 и 7 (случайных) в одном файле, а остальные - в другом. Есть ли способ, которым я могу это сделать?