Из того, что я знаю о СД Кохонена, их специфическая нормализация на самом деле не имеет значения.
Что ж, это может быть сделано путем конкретного выбора значения параметров алгоритма обучения, но самое главное, чторазные размеры ваших входных точек должны быть одинаковой величины.
Представьте, что каждая точка данных - это не пиксель с тремя компонентами RGB, а вектор со статистическими данными для страны, например, площадь, население,.... Для сближения обучающей части важно, чтобы все эти числа имели одинаковую величину.
Следовательно, не имеет значения, если вы не знаете точный диапазон, вам просто нужноприблизительно знать характерную амплитуду ваших данных.
Для веса и размера я уверен, что если вы разделите их соответственно на 200 кг и 3 метра, все ваши точки данных попадут в интервал] 0 1].Вы можете даже использовать 50 кг и 1 метр. Важно то, что все координаты будут иметь порядок 1.
Наконец, вы можете рассмотреть возможность использования некоторых инструментов линейного анализа, таких как POD, для данных, которые автоматически предоставят вам способчтобы нормализовать ваши данные и подпространство для инициализации вашей карты.
Надеюсь, это поможет.