Стоит ли ожидать повторяющихся результатов со случайной инициализацией параметров для совместной фильтрации? - PullRequest
0 голосов
/ 20 февраля 2020

Я пытаюсь реализовать совместную фильтрацию с помощью алгоритма, представленного в рамках курса Coursera Машинное обучение , в реальной реализации. Я изо всех сил пытаюсь заставить результаты повторяться - это означает, что все те же входные данные производят разные предсказания при каждом запуске алгоритма.

Алгоритм, предоставленный курсом, указывает, что начальные значения X / Theta должны быть устанавливается случайным образом и даже делает это в процессе программирования, но в моей реализации мои прогнозы не повторяются, если не используются неслучайные начальные значения.

Вещи, которые я проверял:

  • Установка начальных значений X / Theta на 0, все прогнозы сходятся к среднему (нормализованный ввод)
  • Установка начальных значений X / Theta произвольных, но последовательных значений, это «работает», означая, что предсказания повторяются, но я не t знать, повлияет ли это на качество прогнозов
  • Корректировка других параметров; лямбда, количество функций, количество существующих рейтингов. Похоже, что ни один из них не влияет на повторяемость предсказаний

Вопрос: Требуется ли использовать случайные значения для начальных значений X / Theta или существуют другие приемлемые методы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...