Я строю тренировочный набор, состоящий из двух типов звездных вспышек, и планирую использовать SVM в качестве алгоритма классификации.Мои тренировочные образцы - это временные ряды различной длины.Всего около 500 образцов.Самый короткий - 20 минут (соответствует 20 точкам в направлении x), а самый длинный - 70 минут.Я работал с SVM в прошлом, но только когда тренировочные образцы были одного измерения, поэтому я немного запутался, работая с этими данными.
sample1 = [228421.97, 228412.2, 226350.36, 228682.45, 235230.8, 249476.31, 295342.9, 305726.47, 306297.34, 317928.06, 331425.4, 327457.47, 319601.56, 313681.66, 306458.88, 300534.8, 293425.3, 288308.03, 283743.7, 279555.72, 275912.3, 272426.12, 269431.3, 266490.78, 263824.62, 261392.8, 258859.69, 256228.75, 255648.2, 254316.77, 251989.42, 250020.62, 247674.14, 246597.3, 244943.7, 244279.78, 243340.23, 242705.12, 241383.89, 239908.98, 238534.95, 236921.12, 235440.22, 234578.12, 233270.67, 232202.02, 231123.97, 230130.36, 229262.83, 228603.64, 227440.86, 227012.31, 226822.05, 225729.5]
sample2 = [267696.7, 267586.12, 268090.72, 268305.1, 268942.22, 269092.88, 269458.84, 269155.94, 268905.47, 268673.03, 268369.0, 268508.2, 268662.9, 268685.78, 268573.16, 268199.78, 268328.06, 268362.0, 268146.84, 268436.38, 268229.38, 268249.28, 268337.03, 268758.3, 268743.12, 268490.2, 268568.16, 268580.66, 268372.88, 268252.2, 268331.72, 268195.72, 268362.84, 268026.47, 268039.1]
Два приведенных выше примера демонстрируют различия в размерах образцов обучающего набора.Стратегия, о которой я сейчас думаю, состоит в том, чтобы интерполировать так, чтобы в каждой выборке было ровно 70 записей, равных самой длинной, но я не уверен, что это оптимально в этом случае.
Я был бы очень признателен за любые предложения и /или приводит к соответствующей литературе, чтобы я мог изучить это.