Я работаю над проблемой классификации текста, для которой не могу придумать или найти решение. По сути, я классифицирую частную базу данных жалоб, в которой есть пользовательские категории для каждого муниципалитета, потому что у некоторых муниципалитетов есть другие проблемы, чем у других.
Пример:
Mun. Issue Class
London Street lights are off Street-lighting
New York Street lights are off lighting
Как видите, я хочу классифицировать проблема, основанная на муниципалитете, таким образом, на основе первого столбца, выберите только определенные c категории этого муниципалитета, а затем выберите категорию, которая классифицируется по проблеме. В настоящее время я создал суперклассы, которые содержат похожие классы, но теперь я хочу быть более конкретным c. У меня большой набор данных, и в каждом муниципалитете около 10 классов.