Запрос о функциях потерь для моделей LSTM (двоичная классификация) - PullRequest
1 голос
/ 14 июля 2020
• 1000 У меня есть отдельный файл меток, в котором движения цен классифицируются как 1 или 2 (из-за памяти).

Из того, что я читал, похоже, что для двоичной классификации наиболее подходят две функции потерь:

  1. Двоичная кросс-энтропия
  2. Потеря шарнира

Я реализовал две отдельные модели LSTM в Google Colab, которые работают, как ожидалось.

У меня один и тот же код для обеих моделей, только функция потерь изменена с потери квадратного шарнира в первом случае на двоичную перекрестную энтропию во втором.

Моя проблема заключается в том, чтобы решить, какая модель лучше, поскольку выходные данные модели дают противоречивые выходные данные.

Выходные данные потери шарнира:

Выходные данные обучения:

  1. Потеря начинается с 0,3, затем идет до 0,20 после и остается в значительной степени постоянным в течение оставшихся 98 эпох.
  2. MSE незначительно снижается по эпохам с 2,8 до 1,68 в конце. Среднее значение MSE = 1,72.
  3. Точность составляет 0,00 для каждой эпохи (чего я не понимаю).

Результат проверки:

  1. Проверка убыток начинается с 0,0117 и к концу достигает 9,8264e-06.
  2. MSE проверки начинается с 2,4 и заканчивается на 1,54. Среднее значение MSE проверки = 1,31.
  3. Точность проверки составляет 0,00 для каждой эпохи (что опять же я не понимаю).

Выход двоичной кросс-энтропии:

Результат обучения:

  1. Потеря начинается с 8,3095, затем увеличивается до 3,83 и остается практически постоянной в течение оставшихся 97 эпох.
  2. MSE делает незначительно уменьшаются по эпохам с 2,8 до 1,68 в конце. Среднее значение MSE = 1,69.
  3. Точность начинается с 0,00 и увеличивается примерно до 0,8 к концу.

Результат проверки:

  1. Потеря проверки начинается с -0,82 и к концу дойдет до -,89.
  2. MSE проверки начинается с 1,56 и заканчивается на 1,53. Среднее значение MSE проверки = 1,30.
  3. Точность проверки начинается с 0,00 и увеличивается примерно до 0,997 к концу.

Итак, теперь у меня есть вопрос:

Почему точность модели SHL 0.00? Есть ли ошибка в моей модели?

Мой код сохранен здесь: https://nbviewer.jupyter.org/github/Ianfm94/Financial_Analysis/blob/master/LSTM_Workings/LSTM_Model.ipynb

Данные обучения * и данные меток сохраняются в следующем месте: https://github.com/Ianfm94/Financial_Analysis/tree/master/LSTM_Workings

* Данные обучения здесь разделены на два отдельных файла из-за ограничения Github размера файла до 25 МБ.

Любая помощь будет принята с благодарностью.

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...