Здравствуйте, я новичок здесь, я надеюсь, что я все правильно ввел, и этот вопрос находится на правильном форуме.Кроме того, я проверял ранее, и ни один предыдущий вопрос, похоже, не сопоставим с этим.
На мой вопрос: в настоящее время я работаю над проверкой кластерных методов с использованием пакета clValid.Сейчас мой набор данных, с которым я работаю, очень большой (от 1000 до 25 000), это генные выражения.Теперь вопрос в том, какие методы проверки наборов данных больших размеров вообще ставятся под сомнение.Может быть, есть другой пакет для проверки кластеризации в пространстве с высоким димеснионом.Должен ли я сделать PCA раньше?насколько большим может быть мой набор данных, чтобы я мог использовать на нем clValdi (я не хочу, чтобы мой компьютер работал часами, или я должен просто запустить его и ждать результата с небольшим набором данных 100x500), я благодарен за каждыйПредложение может быть есть решения, о которых я еще не думал.
clValid