Будет ли SVM работать лучше, когда я делю входной вектор на подвекторы? - PullRequest
0 голосов
/ 11 января 2019

Я новичок в поле SVM.

У меня есть группа данных, ожидающих обучения SVM, которая включает в себя более 1000 данных с 120 факторами для каждого.

Вот один пример ввода данных:

[-0.11755821 -0.10075512  0.10151803  0.39256757 -0.26326531 -0.07868852
 -0.17527933  0.22831978 -0.31280788  0.14285714 -0.39403707  0.30672979
 -0.12385321 -0.0184667  -0.02290076 -0.30263158  0.27551509 -0.30969479
  0.37637795 -0.45238095  0.14104046 -0.18213058  0.43001686  0.0044843
  0.04867257 -0.07977737 -0.20540075  0.22899946 -0.38856016  0.2633015
  0.12752858 -0.38659599  0.6105721  -0.79946092  0.76691729  0.33725029
 -0.44377163  0.60238399 -0.62783172  0.59411765 -0.57446809  0.26283988
 -0.25853659  0.4241573  -0.10886076 -0.47126437  0.32660167 -0.30975769
  0.05882353 -0.16890882 -0.4742968   0.37873754 -0.27656123  0.01510574
  0.11413043 -0.3298791   0.22572665 -0.05882353 -0.08868999  0.12345679
 -0.42976067  0.11458333 -0.20315236  0.44934446  0.27586207 -0.17323651
  0.00572462 -0.04211994  0.03636364 -0.21703297 -0.37283237  0.26768464
 -0.22845087  0.22406877 -0.25274725 -0.48016416  0.47745902 -0.50322261
  0.42907489 -0.37671233 -0.50384347  0.40540541 -0.46545866  0.51890034
 -0.07960199 -0.15698925 -0.1270465   0.26794872 -0.48557692  0.33980583
 -0.12824957 -0.00108342  0.07908251 -0.04526252 -0.07834101  0.07926829
 -0.21894737  0.31349911 -0.37460317  0.32214765  0.16509172 -0.17964694
  0.24976787  0.1408046  -0.17422434 -0.26755218  0.04261364 -0.03025435
 -0.07079182 -0.15484805 -0.30654058  0.18748004 -0.08244142  0.01767152
 -0.11798839 -0.14245014 -0.01835343  0.27981221 -0.52903226  0.66212534]

(120 факторов)

Фактически, я выполнил 24 различных уравнения регрессии в 1 испытании. Каждое уравнение даст 5 числовых результатов, которые в итоге станут моими входными факторами Это означает, что каждые 5 факторов связаны друг с другом.

Другими словами, это должно быть:

[[-0.11755821 -0.10075512  0.10151803  0.39256757 -0.26326531] [-0.07868852
 -0.17527933  0.22831978 -0.31280788  0.14285714] [-0.39403707  0.30672979
 -0.12385321 -0.0184667  -0.02290076] [-0.30263158  0.27551509 -0.30969479
  0.37637795 -0.45238095]  ...  [-0.14245014 -0.01835343  0.27981221 -0.52903226  0.66212534]]

(24 5-значных коэффициентов) в качестве входного вектора.

А вот и мой вопрос:

Будет ли svm работать лучше, когда я сгруппирую свои входные данные как 24 1 * 5 функций, а не используя 120-независимый вход функции?

...