Я новичок в машинном обучении, и у меня проблема с одним этапом в моем запланированном анализе.Я пытаюсь приблизить некоторые из моих данных ЭЭГ с ML, чтобы определить, какие сети функциональных связей в мозге изменены у детей, у которых развивается аутизм.Предиктор / ответ будет поведенческим «показателем ASD», и около 300 значений связности будут служить функциями.Размер выборки = 63.
С учетом подобных подходов в литературе и применения их к моей проблеме, я планирую:
1) Выполнить перекрестный выбор функций (определить, какой из300 будет самой полезной в моей модели).
2) Обучите модель регрессии опорных векторов, используя методы «оставь один раз», чтобы определить, может ли модель предсказать более поздние поведенческие оценки ASD.
3) Используйте бета-веса, чтобы определить, какие нейронные связи наиболее «предсказывают» последующую оценку ASD.
Я действительно изо всех сил пытаюсь перейти от шага 2 к 3 ... Я знаю, что не могу просто проверить, какие соединения коррелируют с поведением во всем образце, и использовать эти соединения для обучения модели «один на один»...
Наилучший подход, который я имею до сих пор, - это использование в Matlab sequentialfs с разделом без выхода.Я чувствую, что это все еще смещено, хотя, поскольку из того, что я могу собрать это, B) для каждого N = 63 обучающего образца / сгиба строит подмножество особенностей, которое лучше всего минимизирует MSE, и B) выбирает подмножество признаков из N = 63 сгибовс минимальным MSE .... Итак, использование этого единственного подмножества функций будет представлять собой сгиб с одним оставленным предметом, что похоже на выбор соединений на основе всего образца?