Допустим, у меня есть два numpy массива, откуда они взяты из разных источников данных.
a = [[ 1.1 -0.1 0.1 -0.9 ]
[ 1.7 -0.2 0.1 -0.8]
...
[ 1.7 -0.3 0.7 -0.6 ]]
и
b = [[ 1.9 0.7 0.4 -0.8 ]
[ 1.8 0.1 0.1 -0.8 ]
...
[ 1.4 0.1 0.9 -0.8]]
, которые имеют форму (1000,4)
каждый .
Но я хочу объединить эти две данные и обучить MLP model
, указав различные категориальные источники данных. Тогда как я могу объединить эти данные? Какой encoding method
подойдет? One hot encoding
или Integer encoding
? Я пытался использовать Integer encoding
, но поскольку их источники данных не имеют никакой корреляции, я думаю, что мы не можем использовать Integer encoding
.
Более того, поскольку One hot encoding
используется в категориальных данных, мы также не можем использовать их потому что исходные данные не похожи на категориальные.
Поскольку я использую Keras для модели, для меня было бы лучше использовать Keras API.