Применение LSTM к табличным данным (не изображениям / текстам) для классификации и оценки показателей эффективности - PullRequest
0 голосов
/ 19 февраля 2019

Этот вопрос основан на LSTM на последовательных данных, предсказании дискретного столбца и полезном принятом ответе, с которым я столкнулся.Ответ дает представление о том, что LSTM может быть многообещающим с хорошей производительностью в наборе данных (я приближаюсь к точности 96,4%, используя Ensemble Bagged Trees для моих данных, и ожидаю повышения производительности с помощью LSTM, как порядок строк в данныхэто важно).Я пытаюсь применить LSTM к табличному набору данных в следующем формате: - Пример структуры данных

В основном это тип временных рядов для задачи классификации последовательности для классификации 14 меток /цели в последнем столбце табличного набора данных.Я имел в виду принятый ответ по ссылке, упомянутой выше, но был сбит с толку тем аспектом, что оценка производительности LSTM в классификации в эталонном ответе Stackoverflow была сделана только для обучающего набора данных, и никакие показатели производительности не оцениваются длятестовый набор данных.Я также пытался разделить данные, используя sklearn.model_selection.train_test_split, но это не работает, в этом смысле размеры тензоров не совпадают.Метки в последнем столбце моих данных являются категориальными (строковый тип), поэтому было бы также необходимо преобразовать данные в метки с горячим кодированием / с использованием кодировщика меток, в отличие от контрольного вопроса.Я не уверен, как поместить новые данные в модель для тестирования и получения прогнозов в том же строковом / категориальном формате, что и исходные метки в моих данных.

Я был бы очень признателен, если бы было какое-либо руководство по производительностилюбезно предоставлена ​​оценка модели LSTM на тестовом наборе (например, разделение данных на 70-30%) из таблицы.Кроме того, аналогично моделям машинного обучения, существует ли подходящий подход для разработки матрицы путаницы для классификаций и получения предсказанных классов в метках строкового типа (в исходном категориальном формате)?

...