Как смешать категориальные данные, требующие одноразового кодирования, с непрерывными данными в тензорном потоке? - PullRequest
0 голосов
/ 15 октября 2018

У меня есть смесь категориальных входов и непрерывных входов.Категориальные входы не являются двоичными, поэтому требуется горячее кодирование.Как вы можете создать такую ​​ситуацию для tenorflow?

1 Ответ

0 голосов
/ 15 октября 2018

Вы можете использовать функциональные столбцы.Документы Tensorflow - лучшее место для начала поиска вашего ответа:

https://www.tensorflow.org/guide/feature_columns

Чтобы создать столбцы объектов, вызовите функции из модуля tf.feature_column.Этот документ объясняет девять функций этого модуля.Как показано на следующем рисунке, все девять функций возвращают либо объект категорийного столбца, либо объект плотного столбца, кроме bucketized_column, который наследуется от обоих классов:

enter image description here

Чтобы объединить результат ваших категориальных переменных с числовыми переменными, вы можете использовать «глубокую и широкую» модель, объединяющую два типа функций:

https://www.tensorflow.org/api_docs/python/tf/estimator/DNNLinearCombinedClassifier

for each column in dnn_feature_columns + linear_feature_columns:
- if column is a _CategoricalColumn, a feature with key=column.name whose value is a SparseTensor.
- if column is a _WeightedCategoricalColumn, two features: the first with key the id column name, the second with key the weight column name. Both features' value must be a SparseTensor.
- if column is a _DenseColumn, a feature with key=column.name whose value is a Tensor.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...