Как извлечь особенности из текстовых данных в Python? - PullRequest
0 голосов
/ 15 февраля 2019

Я пытаюсь построить алгоритм машинного обучения, чтобы предсказать число, которое человек думает, основываясь на сигналах мозга ЭЭГ. Набор данных, который я нашел, доступен в текстовом формате и описывается как: «Данные хранятся в оченьпростой текстовый формат, включающий:

[id]: числовой, только для справочных целей.

[event] id, целое число, используемое для различения одного и того же события, захваченного в разных местах мозга, используетсятолько для многоканальных устройств (все, кроме MW).

[устройство]: строка из 2 символов для идентификации устройства, используемого для захвата сигналов, «MW» для MindWave, «EP» для Emotive Epoc, «MU»"для Interaxon Muse и" IN "для Emotiv Insight.

[канал]: строка для определения местоположения сигнала 10/20 в мозгу с возможными значениями:

MindWave" FP1"EPOC" AF3, "F7", "F3", "FC5", "T7", "P7", "O1", "O2", "P8", "T8", "FC6", "F4", "F8 "," AF4 "Muse" TP9, "FP1", "FP2", "TP10" Insight "AF3," AF4 "," T7 "," T8 "," PZ "

[код]:целое число, чтобы отступитьукажите цифру, которая была продумана / замечена, с возможными значениями 0,1,2,3,4,5,6,7,8,9 или -1 для случайных захваченных сигналов, не связанных с какой-либо из цифр.

[размер]: целое число, чтобы определить размер в количестве значений, захваченных за 2 секунды этого сигнала, поскольку Гц каждого устройства изменяется, в «теории» значение близко к 512 Гц для МВт, 128 Гц для EP,220 Гц для MU и 128 Гц для IN, для каждой из 2 секунд.

[данные]: набор чисел, разделенных запятой, с амплитудой временного ряда сигнала, каждое устройство использует различную точность для идентификацииэлектрический потенциал, захваченный мозгом: целые числа в случае MW & MU или действительные числа в случае EP & IN.

В файлах нет заголовков, каждая строка является сигналом, а поляразделены вкладкой " Как мне работать с этими данными (построить данные, обучить разные модели на них)?Должен ли я преобразовать это в другой формат?если да, то как? ссылка на набор данных- http://www.mindbigdata.com/opendb/MindBigData-MW-v1.0.zip

Я уже использовал csv-файл для аналогичного проекта ml, но не знаю, как его использовать, так как перед каждымданные сигнала, как извлечь эти сигналы

1 Ответ

0 голосов
/ 25 февраля 2019

Поля разделены табуляцией, вам нужно только [код] (цифра) или 5-е поле и 7-е поле [данные] (после того, как вы извлечете его, разделите)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...