Я пытаюсь классифицировать лингвистическую переменную о работе в ее наиболее похожую категорию (нет переменной категории, поэтому, я думаю, я мог бы сделать так, чтобы извлечение с помощью PMI или RAKE было наиболее частыми словами из переменной вакансии)
Дело в том, что переменная задания - это свободный чемпион, поэтому вы можете написать все, что угодно, поэтому в любом случае потребуется очистка. И строки содержат такие вещи, как «продавец-консультант, ответчик», поэтому было бы необходимо добавить правила, которые придают большее значение «помощник по продажам», чем «ответчик», и присвоить этой работе категорию «продавец-консультант»
Я думаю о нейронных сетях или деревьях решений, может ли это сработать? Как это можно сделать?