Нет смысла использовать это только для двумерных данных.
Оба работают очень хорошо для трехмерных данных.
Я бы сказал, что размеры до 50обычно просто отлично.Впоследствии это в конечном итоге становится сложным, в зависимости от ваших данных.Например, цветные гистограммы с сотнями измерений могут работать нормально.Так что текст может быть, потому что его внутренняя размерность обычно намного меньше, но я не думаю, что DBSCAN - хороший выбор для текста.Сферическое k-средних даже является стандартной техникой кластеризации текста с «формально» 50000+ размерами ...
Низкая размерность важна для подходов на основе сетки .Но ни DBSCAN, ни k-means не основаны на сетке.Я бы предпочел не использовать DenClue.