Я хочу разбить на график две категориальные переменные следующим образом
from matplotlib import pyplot as plt
a=[1,1,1,1,2,2]
b=[2,2,2,2,1,1]
plt.scatter(a,b)
Если я нанесу это на график, я увижу только две точки (4 перекрываются в (1,2) и 2 перекрываются в (2,1)), не имея возможности оценить различное вхождение двух перекрывающихся точек.

Я хотел бы видеть график рассеяния, где маркер точки слева (1,2) в два раза больше, чем маркер в точке справа (2,1), чтобы показать другое вхождение точки. Как правильно это сделать? (рядом с тривальным решением, где я считаю события вручную и помещаю их в аргумент size
plt.scatter
)
Я уже искал другие вопросы SOF, но все они предлагают использовать альфа как здесь , но я хотел бы видеть размер маркера, чтобы лучше оценить различные пропорции между вхождениями.
Указатель может использовать некоторую оценку плотности ядра, как это предлагается в в этом ответе
Чтобы дать немного больше контекста к моему вопросу, два вывода - это предсказания двух классификаторов, и я хочу изучить различия между предсказаниями, чтобы оценить, стоит ли их объединять.