Я ищу эмпирически оцененные точные и надежные модели классификации текста (реализация Python), которые существуют на GitHub
У меня есть набор меток и ключевых слов, связанных с этими метками.Мне нужно использовать это в качестве поискового словаря для классификации предложений, которые наиболее похожи на ключевые слова, в конкретную категорию ярлыков.Например, если есть банк с именем метки и у него есть связанные ключевые слова, такие как деньги, транзакции, депозиты, кредит;тогда предложения, имеющие такие ключевые слова, должны быть классифицированы в категорию банков.
Я натолкнулся на такую модель на Github: https://github.com/yumeng5/WeSHClass, и эта модель была оценена.
Такв основном я ищу метод классификации текста на основе модели поиска.Есть еще идеи или данные, связанные с этим?