Как использовать plt.scatter () для визуализации центрированного набора данных? - PullRequest
0 голосов
/ 25 апреля 2020

с заданным случайным набором данных, который мы назовем X

import numpy as np
import matplotlib.pyplot as plt
X = # a dataset

Как мне центрировать данные и построить их? Я знаю, что должен использовать

 np.mean(X, #something)

для центрирования данных. Но как мне построить / визуализировать это с помощью функции plt.scatter ()?

1 Ответ

0 голосов
/ 25 апреля 2020

Просто вычтите среднее значение каждой переменной из каждого значения. Для двухмерного случая:

plt.scatter(X[:, 0] - X[:, 0].mean(), X[:, 1] - X[:, 1].mean(), s=75)
plt.scatter(0, 0, c='r', s=75)  # mean is now 0, 0
plt.xlim((-0.75, 0.75))
plt.ylim((-0.75, 0.75))

img

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...