Выходной индекс ЭЛКИ - PullRequest
       45

Выходной индекс ЭЛКИ

0 голосов
/ 10 декабря 2018

Я использую ELKI для кластеризации данных из файла CSV

Я использую

-resulthandler ResultWriter
-out folder/

для сохранения выходных данных

Но в качестве вывода у меня есть некоторые странные индексы

ID=2138 0.1799 0.2761
ID=2137 0.1797 0.2778
ID=2136 0.1796 0.2787
ID=2109 0.1161 0.2072
ID=2007 0.1139 0.2047

Удостоверение личности более 2000, несмотря на то, что у меня менее 100 обучающих образцов

1 Ответ

0 голосов
/ 10 декабря 2018

DBID являются внутренними;в документации ясно сказано, что вы не должны делать из них слишком много предположений, потому что их реализация может изменить .Единственная причина, по которой они вообще записываются в вывод, заключается в том, что некоторым методам (таким как OPTICS) может потребоваться перекрестная ссылка на объекты по этому уникальному идентификатору.

Поскольку они должны быть уникальными идентификаторы, они обычно непрерывно увеличиваются.В следующий раз, когда вы нажмете «выполнить» в MiniGUI, вы получите следующие n идентификаторов ... так ясно, что вы щелкнули «запустить» более одного раза.

«Советы и хитрости» в документации ELKI DBIDвероятно, ответьте на свой основной вопрос - как использовать DBID карты для номеров строк вашего входного файла.Наилучшим способом является , если вы хотите иметь идентификаторы объекта, назначьте идентификаторы объекта самостоятельно , используя столбец идентификатора (и сконфигурировав его как внешний идентификатор).

Для получения дополнительной информации см.документация: https://elki -project.github.io / dev / dbids

...