Как определить соответствующий вес значений в категориальном признаке при обучении модели линейной регрессии в тензорном потоке? - PullRequest
1 голос
/ 03 апреля 2020

Я обучил модель линейной регрессии с использованием тензорного потока. У меня есть как числовые, так и категориальные черты. В этом примере одним из категориальных признаков является has_Alt, который принимает значение 0 или 1. Когда я пытаюсь получить значение весов, соответствующих этому признаку, я получаю двумерный вектор - [[0.23342037] [0.22178642]].

Как узнать, какой вес соответствует значениям 0 и 1 в предоставляемой функции.

Может показаться заманчивым сказать, что первое - это 0, а второе - 1. Однако что, если значения были бы зелеными и синими. Как бы мы тогда узнали? Ниже приведен фрагмент кода того, как я добавляю функции.

def get_feature_columns(dftrain):
    CATEGORICAL_COLUMNS = ['hasAlt']

    feature_columns = []
    for feature_name in CATEGORICAL_COLUMNS:
        vocabulary = dftrain[feature_name].unique()
        feature_columns.append(tf.feature_column.categorical_column_with_vocabulary_list(feature_name, vocabulary))
    return feature_columns
...