Я написал несколько алгоритмов кластеризации, чтобы понять их. Они бегают отлично. Но я хотел бы знать, насколько хорошо они работают при добавлении шума. Я не совсем уверен, как добавить шум к моим данным.
Достаточно ли небольшого возмущения в каждом предмете, например
Оригинал: 1, 2,34, 3,2346, 4,234, 5,235, 6,245, 7,45
2, 3,54, 4,2646, 2,24, 4,25, 6,25, 4,5 ....
Новый найдет дисперсию каждого столбца, а затем добавит ее к каждому элементу столбца.
Или я могу добавить новый набор предметов, который был бы далеко от каждого кластера? Если так, то как бы я это сделал?