В настоящее время я работаю над созданием моего наивного алгоритма Байеса и пытаюсь избежать жесткого кодирования всех имен. Мне было интересно, как я могу использовать ключ dict для итерации по столбцам df без фактического упоминания имени столбца, так как это сделает алгоритм бесполезным для разных наборов данных. Спасибо!
train = pd.read_csv("train.csv")
test = {"feature_1":1, "feature_2":1, "feature_3":0, "feature_4":1}
def naive_bayes_predict(train, test):
probs1= {}
for keys in test:
probs1[keys] = len(train[(train.target == 1) & (train.keys == test[keys])]) / len(train[train.target == 1])