Я пытаюсь воссоздать что-то похожее на sklearn.preprocessing.LabelEncoder
Однако я не хочу использовать sklearn
или pandas
. Я хотел бы использовать только numpy
и стандартную библиотеку Python. Вот чего я хотел бы достичь:
import numpy as np
input = np.array([['hi', 'there'],
['scott', 'james'],
['hi', 'scott'],
['please', 'there']])
# Output would look like
np.ndarray([[0, 0],
[1, 1],
[0, 2],
[2, 0]])
Было бы также здорово иметь возможность отобразить его обратно, так что результат тогда выглядел бы точно так же, как ввод.
Если бы это было в электронной таблице, входные данные выглядели бы так: