Я пишу input_fn для оценки тензорного потока точно так же, как в приведенном ниже руководстве:
def _parse_line(line):
fields = tf.decode_csv(line, FIELD_DEFAULTS)
features = dict(zip(COLUMNS, fields))
features.pop("DATE")
label = features.pop("LABEL")
return features, label
def csv_input_fn(csv_path):
filenames = [join(csv_path, f) for f in os.listdir(csv_path)]
dataset = tf.data.TextLineDataset(filenames).skip(0)
dataset = dataset.map(_parse_line)
return dataset
Но для классификации мне нужно превратить свои ярлыки в ярлыки с одним горячим ярлыком, а также они должны поместить их в особую категорию по границе.
Например, значения от 0 до 2 - это одна категория, а значения от 2 до 5 - для другой категории. Тогда, если моя метка равна 4.1, вывод должен быть [0, 1], если значение моей метки равно 0,5, тогда вывод должен быть [1, 0]
Я думаю, что код должен быть добавлен в функцию _parse_line, но есть идеи, как это сделать? Большое спасибо!