Weka с отсутствующими ценностями - PullRequest
0 голосов
/ 22 марта 2012

У меня вопрос о weka как об этом человеке:

Привет всем:

Мне было очень странно из-за WEKA по этому поводу.

Я подготовил файл CSV, в котором много пропущенных значений.Одно пропущенное значение в этом файле является базовым, просто нет никакого значения между парой запятых, т.е. random_value1, random_value2.Это пример формата.Вы можете видеть, что есть пара запятых, между ними просто ничего, даже white_space, и это должно указывать на отсутствующее значение данных.

Странно то, что когда я читаю этот CSV в WEKA, WEKA присваивает все пропущенные значения вопросительному знаку, то есть '?'.Именно так WEKA выражает это.

А потом, когда я запустил анализ тестирования, WEKA начал работать над этими '?'как какая-то полезная информация.Это просто пропущенные значения, WEKA, пожалуйста, просто перепрыгнуть через это?

Эти проблемы стали действительно бесполезными.Результаты анализа читаются как пропущенные, так и отсутствующие значения, отсутствующие связи с отсутствующими, отсутствующие корреляты.

Может ли WEKA считывать пропущенное значение как пропущенное, а не какие-то знаки вопроса?Или я могу сказать WEKA, что для всех '?' Рассматривать их как пропущенные значения?

Спасибо, ребята

Он решил свою проблему с помощью этого решения:

Я нашел способ рассказать WEKA о пропавших без вести.Просто используйте функцию fine_and_replace в редакторе ASCII, замените все '?'к?

>

но я не знал, как можно скачать ASCII Editor и использовать его, может кто-нибудь сообщить мне ????

Ответы [ 2 ]

2 голосов
/ 23 марта 2012

Я предлагаю вам использовать notepad2 или notepad ++ в Windows.

0 голосов
/ 30 марта 2012

Вам не нужно работать с пропущенными значениями. Различные алгоритмы работают по-разному на пропущенных значениях. Так что не волнуйтесь, все будет обработано так, как должно быть

...