При выборке или избыточной выборке набора данных с использованием Weka - PullRequest
0 голосов
/ 26 мая 2019

Привет! Я использую Weka Framework для выполнения задачи интеллектуального анализа данных. Мой набор данных очень дисбаланс. Когда класс состоит из 1463 ярлыков, а другой состоит из 104. Если я выберу выборку, то большее число классов станет 104, а общее число переменных станет 208. Я чувствую, что это потеря информации.

Какой вариант будет наиболее подходящим для использования в таких случаях.

enter image description here

1 Ответ

0 голосов
/ 27 мая 2019

Вы можете попробовать перевесить с помощью фильтра ClassBalancer. enter image description here

Это сохранит все ваши экземпляры, просто взвесьте их.

...