Разброс графиков мультиклассовых меток - PullRequest
1 голос
/ 14 марта 2019

Я пытаюсь реализовать технику SMOTE и поэтому хочу визуализировать свои ярлыки.Эта техника помогает мне решить проблему дисбаланса данных.

У меня есть, скажем, 1000 меток 1, 2, and 3, а число 100, 100, 800 соответственно.После SMOTE я добавлю синтетические значения, чтобы у меня было 800, 800, and 800 для 1, 2, and 3 меток.

Теперь я хочу нанести эти метки до и после SMOTE.Я разделил свой набор данных на train_X и train_y.Я попытался настроить код радужной оболочки в моем наборе данных, но мне это не удалось.Это то, что я пытался (ничего не рисует и выдает ValueError: 'c' argument has 154 elements, which is not acceptable for use with 'x' with size 25, 'y' with size 25. ошибка):

from matplotlib import pyplot as plt

features = train_X
target = train_y.values.ravel()

plt.scatter(features[0], features[1], alpha=0.2,
            s=100*features[3], c=target, cmap='viridis')
plt.xlabel("L1")
plt.ylabel("L2");
plt.show()

Как я могу нарисовать свои метки разными цветами, чтобы я мог посмотреть, как распределяются значения?

...