В чем разница между разницей между als.train (, als.fit (), als.traimImplicit ()
Прежде всего, мы должны знать разницу между неявной и явной обратной связью.
явное предпочтение (также называемое «явной обратной связью»), такое как «оценка», присваиваемая элементу пользователями.
неявные предпочтения (также называемые «неявной обратной связью»), такие как «просмотр» и «покупка» истории.
Для лучшего понимания вы можете посмотреть ниже две ссылки:
Почему ALS.trainImplicit дает лучшие прогнозы для явных рейтингов?
https://stats.stackexchange.com/questions/133565/how-to-set-preferences-for-als-implicit-feedback-in-collaborative-filtering
train и trainimplicit используются в пакете mllib, который используется для данных rdd. В спарк-фрейме spark появился новый модуль с именем ml. В пакете ml для расчета рейтингов используется фрейм данных spark, и название метода подходит. метод подгонки из мл использовать матричную факторизацию. для более подробной проверки выполните c для класса ALS (мл).
https://github.com/apache/spark/blob/926e3a1efe9e142804fcbf52146b22700640ae1b/python/pyspark/ml/recommendation.py
Кроме того, модуль ml быстрее, чем mllib.
В чем разница между пакетами Spark ML и MLLIB