Найти наилучшие доступные данные в заданном наборе данных в соответствии с входными данными, используя WEKA? - PullRequest
0 голосов
/ 31 декабря 2011

Я пытался использовать четкое название. Я пытаюсь добиться того, чтобы у меня был список данных, как показано ниже

ID - ID человека, не важный в расчете, но необходимый для вывода, чтобы определить человека Образование {1 = Степень, 2 = Магистр, 3 = Кандидат наук}
CGPA - значение от 2,00 до 4,00
Компьютер = {1 = Да, 0 = Нет} (Знание компьютера)
За границей = {1 = Да, 0 = Нет} (желающий путешествовать за границей)

ID, Образование, CGPA, Компьютер, Oversea
001,3,3.14,1,0
002,1,3.68,1,1
003,2,2.76,0,1
..........
.........

Скажем, у меня 1000 строк с разными значениями. Моя цель состоит в том, чтобы я хотел дать аналогичную 1 строку данных и получить ближайшую запись из 1000 строк. Я использую WEKA.

Я пытаюсь сделать что-то вроде поиска лучшего резюме для конкретной работы.

Я проверил и сделал много примеров, чтобы лучше понять WEKA, но я просто не могу это сделать. Я новичок в ВЕКА. Я пробовал классификаторы и деревья решений, но не смог. Я могу получить прогноз на основе данных, но не могу отфильтровать список данных по заданным данным.

Любая помощь высоко ценится. Любая ссылка, которая направляет меня к любой статье об этом, любой идее или даже какой-то одной искре, будет полезна.

1 Ответ

0 голосов
/ 01 января 2013

Похоже, вы хотите использовать классификатор ближайшего соседа (IBk в Weka).Если вы используете Weka GUI, вы можете получить только класс, поэтому вам придется реализовать некоторый код для извлечения фактического ближайшего соседа.

Посмотрите на этот вопрос для способа сделать это.

...