Изменение цвета точек на точечной диаграмме для разных фиктивных значений - PullRequest
0 голосов
/ 10 декабря 2018

В моем наборе данных у меня есть столбец Price для цен на жилье и 5 столбцов-пустышек для разных мест в городе.Я хочу показать точки данных на диаграмме рассеяния разными цветами.

Например, на точечном графике, включающем все цены домов, я хочу иметь:

  • Красный для всех ценовых точек, когда dummy1, что указывает на нахождение дома в Area1 равно 1.
  • Синий для всех ценовых точек, когда dummy2, который указывает на дом в Area2, равен 2.

и так до последнегоколонка.Как я могу создать этот сюжет?Я могу создать точечный график без цвета, используя plt.scatter(), но не знаю, как добавить цветовой код.

1 Ответ

0 голосов
/ 10 декабря 2018

Посмотрите документы для matplotlib.pyplot.scatter, который описывает параметр c, который может быть

Последовательность цветовых спецификаций длины n.

Вот пример, который создает 100 случайных x и y точек данных.Если значение y больше 5, точка будет синей, иначе красной, как указано в списке c.

import matplotlib.pyplot as plt
import random

x = list(range(100))
y = [random.randint(0, 10) for _ in range(len(x))]
c = ["b" if y > 5 else "r" for y in y]

plt.scatter(x, y, c=c)
plt.show()

Вывод будет выглядеть следующим образом:

enter image description here

...