Привет всем:
Мне было очень странно из-за WEKA по этому поводу.
Я подготовил файл CSV, в котором много пропущенных значений.Одно пропущенное значение в этом файле является базовым, просто нет никакого значения между парой запятых, т.е. random_value1, random_value2.Это пример формата.Вы можете видеть, что есть пара запятых, между ними просто ничего, даже white_space, и это должно указывать на отсутствующее значение данных.
Странно то, что когда я читаю этот CSV в WEKA, WEKA присваивает все пропущенные значения вопросительному знаку, то есть '?'.Именно так WEKA выражает это.
А потом, когда я запустил анализ тестирования, WEKA начал работать над этими '?'как какая-то полезная информация.Это просто пропущенные значения, WEKA, пожалуйста, просто перепрыгнуть через это?
Эти проблемы стали действительно бесполезными.Результаты анализа читаются как пропущенные, так и отсутствующие значения, отсутствующие связи с отсутствующими, отсутствующие корреляты.
Может ли WEKA считывать пропущенное значение как пропущенное, а не какие-то знаки вопроса?Или я могу сказать WEKA, что для всех '?' Рассматривать их как пропущенные значения?
Спасибо, ребята
Я нашел способ рассказать WEKA о пропавших без вести.Просто используйте функцию fine_and_replace в редакторе ASCII, замените все '?'к?
но я не знал, как можно скачать ASCII Editor и использовать его, может кто-нибудь сообщить мне ????