Я только начал использовать R, и у меня возник вопрос о кластерном анализе в R. Я применяю функцию agnes, чтобы применить кластерный анализ для моего набора данных.Но я понял, что результаты кластера и pltrees разные, когда я использовал файл .txt и файл .csv.
Может быть, лучше объяснить мою проблему с изображениями:
Мой набор данных в формате .txt;
Я использовал следующий код для просмотра данных в R;
data01 <- read.table("D:/CLUSTER_ANALYSIS/NumericData3_IN.txt", header = T)
и все в порядке, похоже;
Я применяю анализ кластера,
complete1 <- agnes(data01, stand = FALSE, method = 'complete')
plot(complete1, which.plots=2, main='Complete-Linkage')
И вот дерево данных: 
Я сделал те же шаги с файлом .csv, которыйвключает в себя точно такой же набор данных.Вот набор данных в формате .csv: 
Опять кластерный анализ для файла .csv:
data02 <- read.csv("D:/CLUSTER_ANALYSIS/NumericData3.csv", header = T)
complete2 <- agnes(data02, stand = FALSE, method = 'complete')
plot(complete2, which.plots=2, main='Complete-Linkage')
И pltree совершенно другое, 
Итак, DECIMAL SEPARATOR для txt это COMMA, а для csv файла это DOT.Какие из этих результатов верны?Является ли десятичный разделитель для числового набора данных запятой или точкой в R?