Что означает параметр «lift» в алгоритме Spark FP-Growth? - PullRequest
0 голосов
/ 08 ноября 2019

В настоящее время я играю с алгоритмом анализа корзины, реализованным в Spark 2.4 , который называется FP-Growth . Когда я отображаю правила ассоциации, я вижу их в 4 столбцах: antecedent , , последовательные , достоверность и подъем . И мой вопрос в том, что я не понимаю, что означает колонка lift . Кто-нибудь может мне помочь?

Я добавляю сюда несколько примеров данных:

+-----------------+-----------------+-------------------+------------------+
|antecedent       |consequent       |confidence         |lift              |
+-----------------+-----------------+-------------------+------------------+
|[Water, Bread]   |[Chocolate]      |0.5555517002081888 |1.8312030635778151|
|[Bananas, Bread] |[Chips]          |0.4279642895327702 |1.8312030635778147|
|[Bread, Whisky]  |[Chips]          |0.30338071798697663|1.0               |
|[Bread, Apples]  |[Water]          |0.23370662601263412|1.0               |
|[Bread]          |[Water]          |0.17278234144521842|1.0               |
+-----------------+-----------------+-------------------+------------------+

Ссылка на документацию Spark FP-Growth: https://spark.apache.org/docs/latest/ml-frequent-pattern-mining.html

Большое спасибо

...