Я студент, работающий над проектом, включающим использование данных ЭЭГ для обнаружения лжи.Я буду работать с необработанными данными ЭЭГ по 2 каналам и буду записывать данные ЭЭГ в течение всего времени, пока субъект отвечает на вопрос.Таким образом, данные будут массивом с переменной длиной 2 х, хранящимся в CSV-файле, в котором хранятся показания датчиков от каждого из двух датчиков.Например, это выглядело бы примерно так:
Time (ms) | Sensor 1 | Sensor 2|
--------------------------------
10 | 100.2 | -324.5 |
20 | 123.5 | -125.8 |
30 | 265.6 | -274.9 |
40 | 121.6 | -234.3 |
....
2750 | 100.2 | -746.2 |
Я хочу на основе этих данных предсказать, лжет ли субъект или говорит правду (таким образом, двоичная классификация). Я планировал просторассматривая это как структурированные данные и обучение, основанное на этом.Однако, если подумать, это не сработает вообще по нескольким причинам:
- Порядок, в котором организованы данные, имеет значение, так как это непрерывные данные времени.
- Длина данных является переменной, так как, опять же, это временные данные и время, которое требуется, чтобы субъект лгал / говорил правду непоследовательным.
- Я не знаю, как справиться с наличием нескольких каналовданных.
Как мне настроить модель обучения для этого типа данных?Я думаю, что это проблема «классификации временных рядов», но я не уверен.Любая помощь будет принята с благодарностью.Заранее спасибо!