У меня есть массив Numpy, где первый столбец - это идентификатор, а второй - классификация. Я хотел бы применить большинство голосов, чтобы каждый ID имел только 1 классификацию. Когда частота классификации составляет 50-50, я бы хотел выбрать классификацию случайным образом.
Мой массив выглядит следующим образом:
>>> print(myArray)
array([
[10, 0],
[10, 1],
[101, 0],
[101, 0],
[101, 2],
[102, 0],
[102, 0],
[103, 0],
[103, 1],
[103, 1]])
Я хочу, чтобы он стал таким (на основе голосования большинства)
>>> print(myArray)
array([
[10, 0],
[101, 0],
[102, 0],
[103, 1]])
или
>>> print(myArray)
array([
[10, 1],
[101, 0],
[102, 0],
[103, 1]])