Измените значения индекса как случайные ['0', '1'] в файле TSV - PullRequest
0 голосов
/ 10 июля 2020

У меня есть файл tsv, который содержит 100 тыс. Записей с последовательными значениями индекса, например,

index col1 col2
0     nnn  yyy 
1     nnn  yyy
2     nnn  yyy
3     nnn  yyy
4     nnn  yyy
5     nnn  yyy
.....
99999 nnn  yyy

Мне нужно изменить значения индекса, чтобы они были случайными как ['0', '1'], например,

index col1 col2
0     nnn  yyy 
1     nnn  yyy
1     nnn  yyy
0     nnn  yyy
1     nnn  yyy
0     nnn  yyy
.....
......
1     nnn  yyy

1 Ответ

1 голос
/ 10 июля 2020

Используйте DataFrame.set_index с numpy.random.choice:

df = df.set_index(np.random.choice([0, 1], size=len(df)))

Или аналогичное решение с присвоенным индексом:

df.index = np.random.choice([0, 1], size=len(df))
print (df)
  col1 col2
1  nnn  yyy
0  nnn  yyy
1  nnn  yyy
1  nnn  yyy
0  nnn  yyy
0  nnn  yyy
1  nnn  yyy
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...