Я выполнил правила связывания для своего набора данных, теперь у меня есть список значений (Поддержка, доверие, лифт и т. Д.), И я хочу отфильтровать мои предшествующие элементы только по одному из моих исходных значений, чтобы увидеть их связь сдругие.Я попытался создать новый столбец в данных, который проверяет, появляется ли строка «Оценка вовлеченности» в столбце антецедентов, но я просто получаю ошибку NaN в моем новом столбце.
Я пытался str.match
и str.contains
, но получаю ту же ошибку:
import pandas as pd
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
data = pd.read_csv('HR - YSS Scale.csv')
frequent_itemsets = apriori(data, min_support = 0.05, use_colnames = True)
frequent_itemsets.sort_values('support', ascending = False)
rules = association_rules(frequent_itemsets, metric = 'confidence',
min_threshold = 0.6)
rules["anc is eng"] = rules["antecedents"].str.match('Engagement Score')
rules["anc is eng"] = rules["anc is eng"].map({True: 'Yes', False: 'No'})
rules.sort_values('confidence', ascending = False)
Мне нужен новый столбец с надписью Да или Нет, если антецедентом в этой строке является «Оценка вовлеченности».В настоящее время я просто получаю NaN
ошибку.