У меня проблема с несколькими классами. Я хочу решить эту проблему, используя метод иерархической классификации LCPN (локальный классификатор на родительский узел). Поэтому я вручную разделил исходный набор данных на иерархию из 2 уровней. Уровень 1 имеет четыре родительских класса и каждый из родительских классов имеет дочерние классы (уровень 2). Кто-нибудь знает, является ли приведенный ниже подход верным для решения этой проблемы?
- делит весь набор данных на набор поездов (70%) и набор тестов (30%)
- . обучающий набор (так как он несбалансирован)
- обучите родительский классификатор, используя обученный набор с измененной выборкой, и протестируйте его на всем наборе тестов
для каждого из 4 подклассификаторов в родительском классификаторе : 4. возьмите обучающий набор с измененной выборкой (набор данных, полученный после повторной выборки на шаге 2.) 5. отфильтруйте экземпляры, которые принадлежат только конкретному подклассификатору. Потому что у переделанного набора данных есть экземпляры, которые принадлежат всем 4 подклассификаторам. 6. создать набор данных, используя эти экземпляры. Включая функции и этикетки. 7. разделить созданный набор данных на наборы дополнительного обучения (70%) и дополнительного теста (30%). 8. Передискретизировать набор дополнительного обучения (поскольку классы не сбалансированы). 9. Обучить модель с помощью дополнительного обучения с избыточным отбором. установите на шаге 8. и протестируйте его, используя набор суб-тестов