Как визуализировать корреляцию дискретных данных, используя scatter_matrix в python? - PullRequest
0 голосов
/ 14 марта 2020
for attribute in ['alcohol','chlorides','density']:
    compare = wine_data[["quality", attribute]]
    plot = pp.scatter_matrix(compare)
    plt.show()

Я нашел следующий график. Качество - это целое число в диапазоне 0-10. [«спирт», «хлориды», «плотность»] являются продолжением данных. Соотношения между [«спирт», «хлориды», «плотность»] и качеством составляют 0,432733, -0,305599 и -0,207202 соответственно. Как я понимаю три графика ниже? Есть ли лучший способ визуализации корреляции дискретных данных?

enter image description here

enter image description here

1 Ответ

0 голосов
/ 14 марта 2020

Я предпочитаю функцию регплота Seaborn, которая будет отображать тот же график рассеяния, который вы видите здесь, вместе с линией регрессии сверху. Линия регрессии поможет вам понять, является ли корреляция положительной или отрицательной (наклон вверх / вниз), а также предоставит полосы погрешностей в затенении вокруг линии регрессии.

https://seaborn.pydata.org/generated/seaborn.regplot.html

...