Ответ 1: Поскольку переменные имеют порядковый масштаб, тест хи-квадрат является подходящим тестом измерения. Потому что «критерий хи-квадрат предназначен для анализа категориальных данных. Это означает, что данные были подсчитаны и разделены на категории. Он не будет работать с параметрическими или непрерывными данными (такими как высота в дюймах)». Ссылка .
Опять же, порядковые масштабированные данные - это, по существу, данные подсчета или частоты, которые вы можете использовать обычную параметрическую статистику: среднее значение, стандартное отклонение и т. Д. Или непараметрические тесты, такие как ANOVA
или Mann-Whitney U test
для сравнения 2 групп или Kruskal–Wallis H test
для сравнения три или более групп.
Ответ 2: В проблеме кластеризации выбор метода расстояния зависит только от типа переменных. Я рекомендую вам прочитать эти подробные сообщения 1 , 2 , 3