Есть ли подходящий подход для решения метода LCPN в иерархической классификации - PullRequest
0 голосов
/ 23 февраля 2020

У меня проблема с несколькими классами. Я хочу решить эту проблему, используя метод иерархической классификации LCPN (локальный классификатор на родительский узел). Поэтому я вручную разделил исходный набор данных на иерархию из 2 уровней. Уровень 1 имеет четыре родительских класса и каждый из родительских классов имеет дочерние классы (уровень 2). Кто-нибудь знает, является ли приведенный ниже подход верным для решения этой проблемы?

  1. делит весь набор данных на набор поездов (70%) и набор тестов (30%)
  2. . обучающий набор (так как он несбалансирован)
  3. обучите родительский классификатор, используя обученный набор с измененной выборкой, и протестируйте его на всем наборе тестов

для каждого из 4 подклассификаторов в родительском классификаторе : 4. возьмите обучающий набор с измененной выборкой (набор данных, полученный после повторной выборки на шаге 2.) 5. отфильтруйте экземпляры, которые принадлежат только конкретному подклассификатору. Потому что у переделанного набора данных есть экземпляры, которые принадлежат всем 4 подклассификаторам. 6. создать набор данных, используя эти экземпляры. Включая функции и этикетки. 7. разделить созданный набор данных на наборы дополнительного обучения (70%) и дополнительного теста (30%). 8. Передискретизировать набор дополнительного обучения (поскольку классы не сбалансированы). 9. Обучить модель с помощью дополнительного обучения с избыточным отбором. установите на шаге 8. и протестируйте его, используя набор суб-тестов

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...