Я новичок в НЛП, просто делаю это впервые.Я пытаюсь решить проблему.
Моя проблема в том, что у меня есть некоторые документы, помеченные вручную, например:
doc1 - categoryA, categoryB
doc2 - categoryA, categoryC
doc3 - categoryE, categoryF, categoryG
.
.
.
.
docN - categoryX
Здесь у меня есть фиксированный набор категорий, и любой документ может иметь любое количество тегов, связанных с ним.Я хочу обучить классификатор с помощью этого ввода, чтобы этот процесс тегирования можно было автоматизировать.
Спасибо