Я столкнулся с проблемой двоичной классификации.Я использую некоторые модели машинного обучения и Python 3. Я заметил, что некоторые модели работают лучше в данном классе, чем другие.Я хотел бы объединить их, чтобы улучшить мою точность и аккуратность.Я знаю способ сделать это в регрессионных задачах, что-то вроде средневзвешенного прогнозирования.Но я не уверен, что это имеет смысл в проблеме классификации.И вы должны знать лучший способ сделать это.
Вот мой алгоритм, который помогает мне идентифицировать метки, которые особенно трудно предсказать:
"""
each value is in {0, 1}
ytrue : real values
ypred : predicted values
"""
def errorIdentifier(ytrue, ypred):
n = len(ytrue)
ytrue = list(ytrue)
ypred = list(ypred)
error = [0,0]
for i in range(n):
if ytrue[i] != ypred[i] :
error[ytrue[i]] += 1
return error
Как вы можете догадаться, янужно называть это для каждой модели, которую я использую.