Как создать коэффициент пропущенного значения (10%, 20% и т. д.) из полного набора данных в Python - PullRequest
0 голосов
/ 04 апреля 2019

Может кто-нибудь сказать мне, как создавать наборы данных с пропущенными значениями с разным процентом, например (10%, 20%) из исходных наборов данных в Python.

1 Ответ

0 голосов
/ 04 апреля 2019

10 процентов

import random
a_list = range(25)
print(random.sample(a_list,len(a_list) - len(a_list)//10))

однако порядок не сохраняется

если вам нужно сохранить заказ

import random
a_list = range(25)
indexes = sorted(random.sample(range(len(a_list)),len(a_list)//10),reverse=True)
for i in indexes:
    del a_list[i]
print(a_list)

это один из способов.

, если вы хотите с вероятностью 10% выпустить любой элемент

new_list = [x for x in a_list if random.random()>0.1]
...