WEKA показывает, что моя первая переменная из ARFF-файла начинается с символов ï »¿ - PullRequest
0 голосов
/ 10 апреля 2020

В WEKA я пытался использовать файл ARFF в качестве набора тестов для модели после классификации моих данных обучения (на вкладке классификации), но получил следующую ошибку: «Поезд и набор тестов несовместимы». См. Изображение:

Train and test set are not compatible] 1

Я открыл как оригинальные обучающие, так и тестовые файлы CSV в Excel, и они выглядели одинаково для меня. Я открыл файлы CSV в Notepad ++, и они выглядели одинаково для меня. Однако я открыл тест ARFF в WEKA и обнаружил странные символы в начале имени первого атрибута. См. Изображение:

Strange Characters () appear at the beginning of the first attribute name in WEKA

Почему там находятся странные символы и как их удалить? Мне нужно, чтобы обучающие и тестовые файлы ARFF были совместимы для классификации.

Заранее спасибо.

1 Ответ

0 голосов
/ 10 апреля 2020

Если вы использовали Excel для редактирования тестового файла:
Проверьте, сохранен ли файл в формате файла «CSV UTF-8 (с разделителями-запятыми) (* .csv)», а не в формате «CSV». (Разделенный запятыми) (* .csv) ". Обратите внимание, что последний формат файла не включает «UTF-8».

Если это так, повторно сохраните тестовый CSV-файл в Excel в последнем формате (без UTF-8) и создайте новый файл ARFF. от него. На этот раз WEKA не должен показывать символы «ï» ¿в начале первого атрибута.

...