Мой вопрос относится к этой статье Дэвиса и Чена (2006), в которой показан способ визуализации тау-меры Кендалла для непараметрической корреляции между двумя переменными c.
Учитывая количество точек данных на диаграмме рассеяния, каждая точка связана со всеми остальными точками отрезком линии. Сегмент линии может иметь разные цвета в соответствии с этими критериями:
- сегмент линии равен черный , если его наклон равен положительный ;
- линия сегмент равен красный , если его наклон равен отрицательный ;
- сегмент равен синий имеет его наклон 0 ( горизонтально плоская линия );
- отрезок черный , как в 1. если его наклон не определен ( вертикальная линия ).
Здесь пример из оригинальной статьи:
Моя проблема заключается в том, что я могу создать диаграмму рассеяния, но не сегменты линий, которые соединяют все возможные пары очки, меняющие цвет в зависимости от критериев выше.
Вот пример набора данных:
dataset <- dplyr::tibble(alpha = c(1, 5, 7, 8, 9, 10, 11, 12),
beta = c(7, 7, 5, 4, 3, 14, 15, 18))
Я могу сгенерировать это:
ggplot2::ggplot(dataset, aes(x = alpha, y = beta)) + geom_point()
но не это:
ПРИМЕЧАНИЕ. Решение должно быть обобщено для набора данных с большим количеством точек данных (~ 1000)