ELKI: Как задать столбцы функций CSV для K-Means - PullRequest
0 голосов
/ 09 марта 2020

Я пытаюсь запустить K-Means, используя ELKI Mini GUI. У меня есть набор данных CSV из 15 объектов (столбцы) и столбец метки. Я хотел бы сделать несколько прогонов K-средних с различными комбинациями столбцов функций.

Есть ли где-нибудь в Mini GUI, где я могу указать значения каких столбцов я хотел бы использовать для кластеризации?

Если нет, то как проще всего это сделать? путем изменения / расширения ELKI в Java?

1 Ответ

1 голос
/ 10 марта 2020

Это легко достижимо с помощью кода Java или просто путем предварительной обработки данных по мере необходимости. Создайте 10 вариантов, затем запустите ELKI через командную строку.

Но есть фильтр для выбора столбцов: NumberVectorFeatureSelectionFilter. Чтобы использовать только столбцы 0,1,2 (в части цифра c; метки обрабатываются отдельно в этой точке; это векторное преобразование):

-dbc.filter transform.NumberVectorFeatureSelectionFilter
-projectionfilter.selectedattributes 0,1,2

Фильтр может быть расширен с использованием нашего нового IntRangeParameter для учета спецификаций, таких как 1..3,5..8; но это еще не было реализовано.

...