Я пытаюсь реализовать технику SMOTE
и поэтому хочу визуализировать свои ярлыки.Эта техника помогает мне решить проблему дисбаланса данных.
У меня есть, скажем, 1000 меток 1, 2, and 3
, а число 100, 100, 800
соответственно.После SMOTE
я добавлю синтетические значения, чтобы у меня было 800, 800, and 800
для 1, 2, and 3
меток.
Теперь я хочу нанести эти метки до и после SMOTE
.Я разделил свой набор данных на train_X
и train_y
.Я попытался настроить код радужной оболочки в моем наборе данных, но мне это не удалось.Это то, что я пытался (ничего не рисует и выдает ValueError: 'c' argument has 154 elements, which is not acceptable for use with 'x' with size 25, 'y' with size 25.
ошибка):
from matplotlib import pyplot as plt
features = train_X
target = train_y.values.ravel()
plt.scatter(features[0], features[1], alpha=0.2,
s=100*features[3], c=target, cmap='viridis')
plt.xlabel("L1")
plt.ylabel("L2");
plt.show()
Как я могу нарисовать свои метки разными цветами, чтобы я мог посмотреть, как распределяются значения?