Как применить мою модель к новым данным после тестирования и оценки? - PullRequest
0 голосов
/ 31 марта 2019

Я использовал модель логистической регрессии для набора данных, чтобы предсказать метку.Я обучил 70% данных и протестировал оставшиеся 30%.Теперь у меня есть новые данные с неизвестной меткой, и я хочу применить свою модель к этим данным, чтобы сделать прогноз, однако я не уверен, как это сделать.И мне нужно экспортировать / сохранить новые предсказанные метки в CSV-файл или файл Excel.Кто-нибудь знает, как это сделать?

Я импортировал новые данные, в которых отсутствовал столбец метки.я попытался добавить столбец метки к данным и указать модель на него, но потерпел неудачу, так как знаю только, как разделить данные для обучения и тестирования, но я не знаю, как на 100% прогнозировать невидимые данные, которые я хочу добавить

test = pd.read_csv('test.csv')
Gender = pd.get_dummies(test['Gender'],drop_first=True)
MaritalStatus = pd.get_dummies(test['MaritalStatus'],drop_first=True)
Occupation = pd.get_dummies(test['Occupation'],drop_first=True)
Education = pd.get_dummies(test['Education'],drop_first=True)

test.drop(['FirstName', 'LastName','CountryRegionName', 'PostalCode', 'PhoneNumber',
 'BirthDate','Gender','MaritalStatus','Occupation','Education','BirthDate'],axis=1,inplace=True)

test = pd.concat([test,Gender,MaritalStatus,Occupation,Education],axis=1)

Я хочу, чтобы тестовый файл содержал столбец метки и мог отправлять его в файлы Excel или CSV

...