Как узнать, нужно ли алгоритму машинного обучения (Logisti c регрессия, линейный дискриминантный анализ, K-ближайшие соседи и многие другие) получать закодированную категориальную особенность или нет?
Например, : если я хочу обучить модель с использованием SVM, как узнать, могу ли я использовать строковые метки positive
и negative
в моем наборе данных или мне нужно отобразить ее как {'positive':1, 'negative':0}
?
Тот же вопрос действителен для любых других алгоритмов.
Должен ли я специально проверять документацию каждого из них?