Я провожу серию кластерных анализов в Weka, и я понял, что автоматизация - это путь, если я хочу попасть куда-то. Я немного объясню, как я работаю.
Я делаю всю предварительную обработку вручную в R и сохраняю ее как файл csv , импортируя его в weka и сохраняя снова как файл arff .
Я использую графический интерфейс weka, и в целом я просто открываю свои данные в файле arff и сразу перехожу на вкладку кластеризация и играю. (Мой опыт использования CLI ограничен).
Я пытаюсь воспроизвести некоторые результаты, полученные с помощью графического интерфейса, но теперь с командами в CLI . Проблема в том, что я обычно игнорирую список атрибутов при кластеризации с использованием графического интерфейса. Я не могу найти способ выбора списка атрибутов, которые следует игнорировать в командной строке.
Например:
java weka.clusterers.XMeans \
-I 10 -M 1000 -J 1000 \
-L 2 -H 9 -B 1.0 -C 0.25 \
-D "weka.core.MinkowskiDistance -R first-last" -S 10 \
-t "/home/pedrosaurio/bigtable.arff"
Мой опыт работы с weka ограничен, поэтому я не знаю, упускаю ли я какое-то базовое понимание того, как это работает.