Тренинг по данным переменной длины - классификация данных ЭЭГ - PullRequest
0 голосов
/ 22 сентября 2018

Я студент, работающий над проектом, включающим использование данных ЭЭГ для обнаружения лжи.Я буду работать с необработанными данными ЭЭГ по 2 каналам и буду записывать данные ЭЭГ в течение всего времени, пока субъект отвечает на вопрос.Таким образом, данные будут массивом с переменной длиной 2 х, хранящимся в CSV-файле, в котором хранятся показания датчиков от каждого из двух датчиков.Например, это выглядело бы примерно так:

Time (ms) | Sensor 1 | Sensor 2|
--------------------------------
10        | 100.2    | -324.5  |
20        | 123.5    | -125.8  |
30        | 265.6    | -274.9  |
40        | 121.6    | -234.3  |
             ....
2750      | 100.2    | -746.2  |

Я хочу на основе этих данных предсказать, лжет ли субъект или говорит правду (таким образом, двоичная классификация). Я планировал просторассматривая это как структурированные данные и обучение, основанное на этом.Однако, если подумать, это не сработает вообще по нескольким причинам:

  1. Порядок, в котором организованы данные, имеет значение, так как это непрерывные данные времени.
  2. Длина данных является переменной, так как, опять же, это временные данные и время, которое требуется, чтобы субъект лгал / говорил правду непоследовательным.
  3. Я не знаю, как справиться с наличием нескольких каналовданных.

Как мне настроить модель обучения для этого типа данных?Я думаю, что это проблема «классификации временных рядов», но я не уверен.Любая помощь будет принята с благодарностью.Заранее спасибо!

1 Ответ

0 голосов
/ 05 октября 2018

Проведя дополнительные исследования, я решил использовать сеть LSTM с платформой Keras, работающей поверх TensorFlow.LSTM имеют дело с данными временных рядов, а уровень Keras позволяет передавать данные временных рядов объектов в сеть, поэтому, если у кого-то есть проблема, аналогичная моей, то LSTM или RNN - это путь.

...