У меня есть CSV-файл, который имеет метку для первой строки и содержит 34 столбца и около 21000 строк. Я хочу пропустить метку и объединить строки 2 и 3, чтобы создать длинный ряд с 68 столбцами, дублируя метку, чтобы соответствовать им. Затем сделайте то же самое с другими строками, чтобы я мог сделать прогноз.
Я дошел до этого и хочу знать, работает ли это.
Пример:
A B C ... Z
1 1 1 ... 1
2 2 2 ... 2
3 3 3 ... 3
запрос:
A B C ... Z A B C ... Z
1 1 1 ... 1 2 2 2 ... 2
3 3 3 ... 3 4 4 4 ... 4
import numpy as np
import pandas as pd
import tensorflow as tf
import os
print(os.listdir(r"..."))
train = pd.read_csv(r"...\data.csv")
#constants
filename = 'data.csv'
rows_per_ob = 2
dataset = tf.data.TextLineDataset(filename)
# Skip the header line.
dataset = dataset.skip(1)
# Combine 2 rows into 1 row.
dataset = dataset.batch(rows_per_ob)