Получить индекс / обратный индекс уникальных значений DF с помощью np.unique () - PullRequest
0 голосов
/ 20 мая 2019

Вот стандартный пример, который я хотел бы применить к кадру данных.

Стандартный пример, примененный к массиву с желаемым выводом

import numpy as np

A = np.array([9,2,9,5])

C, ia, ic = np.unique(A, return_index=True, return_inverse=True)  

print(C)
print(ia)
print(ic)

output

[2 5 9]
[1 3 0]
[2, 0, 2, 1]

Как я могу расширить этот пример до фрейма данных? Концептуально я хотел бы достичь тех же результатов, но с кадром данных с несколькими столбцами вместо A. Код ниже не работал для меня.

C, ia, ic = np.unique(DF[['column1', 'column2', 'column3']], return_index=True, return_inverse=True)

Я также попробовал следующее, но я не уверен, что он дает мне правильный ответ.

C, ia, ic = np.unique(DF[['column1', 'column2', 'column3']].values, return_index=True, return_inverse=True)

Любая помощь приветствуется

...