Я хотел бы предсказать 'diffsecond' (последний столбец) по данным метки времени и других строк. Я не знаю, почему моя метка времени не может быть данными обучения. Я ученик Engli sh и извините за грамматическую ошибку. спасибо!
вот данные (безопасная ссылка) (картинка для предварительного просмотра) ----- https://tlgur.com/d/gvqzMLQG (.csv) ----- https://tlgur.com/d/GEzpYENg
вот ошибка (картинка): --- https://tlgur.com/d/Gozay208
вот мой код:
import pandas as pd
import matplotlib.pyplot as plt
import datetime
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
df = pd.read_csv(r'C:\Users\12232\Desktop\bb.csv')
x = df[["TrainActualTime"]]
x["TrainActualTime"] = pd.to_datetime(x["TrainActualTime"],format='%d/%m/%Y %H:%M:%S')
x['loc_stanox'] = df['loc_stanox'].apply(str)
x['Event_type']=df['Event_type']
x=pd.get_dummies(x)
dt=pd.read_csv(r'C:\Users\12232\Desktop\bb.csv')
dt = dt[["diffseconds"]]
print(x)
#x.to_csv(r'C:\Users\12232\Desktop\x.csv')
X_train, X_test, y_train, y_test = train_test_split(x, dt, train_size=0.8,random_state=1)
rf = RandomForestRegressor(n_estimators=1000)
rf.fit(X_train, y_train)
print(rf.predict(X_train))
print("Traing Score:%f" %rf.score(X_test, y_test))