Я хочу наблюдать за распределением классов в каждой мини-партии набора данных, чтобы увидеть, как WeightedRandomSampler
работает в PyTorch.
Как мне go сделать это?
Допустим, размер моей мини-партии равен 8, а количество классов также равно 8.
Например, для мини-партии - [0, 1, 2, 2, 3, 4, 4, 4]
. У меня 863 таких мини-пакета.
Теперь я первоначально, хотя и могу построить линейный график для каждого класса, где ось X содержит номер мини-партии, а ось Y содержит количество классов. Итак, если все 8 классов следуют одному и тому же шаблону (взлет и падение), то я буду знать, что каждый пакет содержит классы взвешенным образом ie. общее распределение классов представлено в каждой партии.
Но этот метод невозможен, учитывая большое количество образцов.
Затем я построил кривые плотности каждого класса во всех мини-пакетах. На следующем рисунке я нанес distplot
для 4 классов.
![enter image description here](https://i.stack.imgur.com/ppaJX.png)
На этом графике я наблюдаю, что взлет и падение каждого графика находятся в одном и том же месте по оси X. Означает ли это, что в моих мини-пакетах есть взвешенное распределение классов?