У меня есть файл .csv с около 5000 строк и 3757 столбцов. Первые 3751 столбец каждой строки являются элементами, а последние 6 столбцов являются метками. Каждая строка представляет собой набор пары признаков-меток.
Я хотел бы знать, есть ли встроенные функции или какие-либо быстрые способы, которыми я могу:
- Разобрать первые 3751 столбец как объекты (у этих столбцов нет заголовков)
- Анализируйте ЛЮБОЙ из последних 6 столбцов как метки, что означает, что я хотел бы вынуть любой из последних 6 столбцов в качестве метки для обучения.
В основном я хочу обучить модель DNN с функциями 3751 и 1 меткой, и я хотел бы, чтобы выходные данные функции синтаксического анализа передавались в следующую функцию для обучения:
train_input_fn = tf.estimator.inputs.numpy_input_fn(
x={"x": np.array(training_set.data)},
y=np.array(training_set.target),
num_epochs=None,
shuffle=True)
Я знаю, что некоторые функции, такие как "tf.contrib.learn.datasets.base.load_csv_without_header", могут делать подобные вещи, но это уже устарело.