Я новичок в поле SVM.
У меня есть группа данных, ожидающих обучения SVM, которая включает в себя более 1000 данных с 120 факторами для каждого.
Вот один пример ввода данных:
[-0.11755821 -0.10075512 0.10151803 0.39256757 -0.26326531 -0.07868852
-0.17527933 0.22831978 -0.31280788 0.14285714 -0.39403707 0.30672979
-0.12385321 -0.0184667 -0.02290076 -0.30263158 0.27551509 -0.30969479
0.37637795 -0.45238095 0.14104046 -0.18213058 0.43001686 0.0044843
0.04867257 -0.07977737 -0.20540075 0.22899946 -0.38856016 0.2633015
0.12752858 -0.38659599 0.6105721 -0.79946092 0.76691729 0.33725029
-0.44377163 0.60238399 -0.62783172 0.59411765 -0.57446809 0.26283988
-0.25853659 0.4241573 -0.10886076 -0.47126437 0.32660167 -0.30975769
0.05882353 -0.16890882 -0.4742968 0.37873754 -0.27656123 0.01510574
0.11413043 -0.3298791 0.22572665 -0.05882353 -0.08868999 0.12345679
-0.42976067 0.11458333 -0.20315236 0.44934446 0.27586207 -0.17323651
0.00572462 -0.04211994 0.03636364 -0.21703297 -0.37283237 0.26768464
-0.22845087 0.22406877 -0.25274725 -0.48016416 0.47745902 -0.50322261
0.42907489 -0.37671233 -0.50384347 0.40540541 -0.46545866 0.51890034
-0.07960199 -0.15698925 -0.1270465 0.26794872 -0.48557692 0.33980583
-0.12824957 -0.00108342 0.07908251 -0.04526252 -0.07834101 0.07926829
-0.21894737 0.31349911 -0.37460317 0.32214765 0.16509172 -0.17964694
0.24976787 0.1408046 -0.17422434 -0.26755218 0.04261364 -0.03025435
-0.07079182 -0.15484805 -0.30654058 0.18748004 -0.08244142 0.01767152
-0.11798839 -0.14245014 -0.01835343 0.27981221 -0.52903226 0.66212534]
(120 факторов)
Фактически, я выполнил 24 различных уравнения регрессии в 1 испытании. Каждое уравнение даст 5 числовых результатов, которые в итоге станут моими входными факторами Это означает, что каждые 5 факторов связаны друг с другом.
Другими словами, это должно быть:
[[-0.11755821 -0.10075512 0.10151803 0.39256757 -0.26326531] [-0.07868852
-0.17527933 0.22831978 -0.31280788 0.14285714] [-0.39403707 0.30672979
-0.12385321 -0.0184667 -0.02290076] [-0.30263158 0.27551509 -0.30969479
0.37637795 -0.45238095] ... [-0.14245014 -0.01835343 0.27981221 -0.52903226 0.66212534]]
(24 5-значных коэффициентов)
в качестве входного вектора.
А вот и мой вопрос:
Будет ли svm работать лучше, когда я сгруппирую свои входные данные как 24 1 * 5 функций, а не используя 120-независимый вход функции?