В настоящее время я играю с алгоритмом анализа корзины, реализованным в Spark 2.4 , который называется FP-Growth . Когда я отображаю правила ассоциации, я вижу их в 4 столбцах: antecedent , , последовательные , достоверность и подъем . И мой вопрос в том, что я не понимаю, что означает колонка lift . Кто-нибудь может мне помочь?
Я добавляю сюда несколько примеров данных:
+-----------------+-----------------+-------------------+------------------+
|antecedent |consequent |confidence |lift |
+-----------------+-----------------+-------------------+------------------+
|[Water, Bread] |[Chocolate] |0.5555517002081888 |1.8312030635778151|
|[Bananas, Bread] |[Chips] |0.4279642895327702 |1.8312030635778147|
|[Bread, Whisky] |[Chips] |0.30338071798697663|1.0 |
|[Bread, Apples] |[Water] |0.23370662601263412|1.0 |
|[Bread] |[Water] |0.17278234144521842|1.0 |
+-----------------+-----------------+-------------------+------------------+
Ссылка на документацию Spark FP-Growth: https://spark.apache.org/docs/latest/ml-frequent-pattern-mining.html
Большое спасибо