Как смоделировать зависимость между входными объектами при построении классификатора - PullRequest
0 голосов
/ 20 октября 2019

У меня есть набор данных в форме (1000,20) (1000 строк, 20 объектов), и я хочу построить для него классификатор. Однако большинство алгоритмов sk-Learn предполагают, что эти 20 функций являются независимыми. В моих функциях есть гауссова зависимость между функциями. Как я могу смоделировать эту зависимость в качестве входных данных для классификатора, такого как SVM или ExtraTreeClassifier?

Спасибо

1 Ответ

0 голосов
/ 22 октября 2019

Используйте ядро, отличное от линейного.

Поскольку вы упомянули, что между вашими функциями есть гауссовская зависимость, я думаю, что радиальная функция RBF лучше всего подходит для вас.

Любая из известных мне библиотек SVMимеет эту опцию для ядра. Например, вы можете проверить документацию scikit-learn для SVM здесь . Давайте посмотрим на пример, который я взял с этой страницы:

from sklearn.svm import SVC
clf = SVC(gamma='auto')
clf.fit(X, y)  

SVC (C = 1,0, cache_size = 200, class_weight = Нет, coef0 = 0.0, solution_function_shape = 'ovr', степень = 3, gamma = 'auto', kernel = 'rbf', max_iter = -1, вероятность = False, random_state = None, сжатие = True, tol = 0,001, verbose = False)

Как вы можетепосмотрите, что ядро ​​по умолчанию установлено на rbf , так что вы можете свободно использовать его.

...