ELKI: оценка LOF как бесконечная - PullRequest
0 голосов
/ 20 февраля 2020

Каков общепринятый и общепринятый способ обработки баллов LOF как inifinite в ELKI из-за дублирования баллов? Если LOF баллы ELKI будут использоваться, следует ли рассматривать такие баллы как максимальные баллы, нули или значения?

1 Ответ

0 голосов
/ 21 февраля 2020

Оценка LOF точки является бесконечной, если хотя бы один сосед точки имеет расстояние достижимости 0 (поскольку они являются дублирующими точками).

Если сама точка имеет ненулевую достижимость, значение таким образом, бесконечно выше, чем Ird соседей (или с точки зрения плотности: точка бесконечно менее плотна, чем соседи), поэтому это выброс .

Правильный путь для этого нужно увеличить k (в минутах), чтобы оно превышало максимальное количество повторяющихся точек. Если у вас слишком много повторяющихся точек, это обычно означает, что использование LOF может быть не очень хорошей идеей для этого набора данных. LOF требует, чтобы оценка плотности ближайшего соседа имела смысл для данных, и если у вас возникают проблемы такого рода, обычно причиной являются входные данные, а не алгоритм.

...