Установить набор данных с 1024 атрибутами в weka - PullRequest
0 голосов
/ 24 октября 2018

Я новичок в weka, и у меня есть набор обучающих данных с большим количеством экземпляров, и каждый экземпляр имеет 1024 двоичных файла, которые показывают пиксели черно-белого изображения 32 * 32, каждый экземпляр на самом деле представляет собой изображение, представляющее буквуалфавит AZ с индексом от 1 до 25 (25 классов). Как мне установить этот набор данных в weka?Я имею в виду, я должен написать 1024 атрибута и 25 классов? Как?

1 Ответ

0 голосов
/ 27 октября 2018

Если я правильно вас понимаю, ваши экземпляры состоят из 1024 двоичных значений, которые будут использоваться для классификации данных, и 25 различных возможных классификаций *.

Если вы сохранили свои данные логическим способом,т. е. используя запятую для разделения всех различных значений, вы можете импортировать данные в Excel.Это должно привести к тому, что ваши данные будут разбиты на 1025 различных столбцов, 1024 столбца, содержащих вашу двоичную информацию, и последний 1025-й столбец, содержащий букву.

После этого вы сможете открыть файл CSV в клиенте WEKA GUI илипреобразуйте файл CSV в файл ARFF для дальнейшего использования, в зависимости от того, что вы предпочитаете.

Вышеупомянутые шаги проиллюстрированы ниже на изображениях с использованием некоторых необработанных данных, которые я собрал несколько дней назад (необработанные данные (.txt)-> Обработка данных (CSV) -> Ввод в WEKA (ARFF)):

Raw data (TXT)

Processing the data (.csv)

Final data(.arff)

* Разве это не должно быть 26 для всех букв латинского алфавита?

...