Мне нравится, как работает Carrot2. В настоящее время я использую в основном XML импорт. Я хотел бы импортировать XML файл с результатами TF-IDF вместо фрагментов. Это позволило бы мне подготовить данные, когда я sh.
Я пытался передать ключевые слова TF-IDF (без метрик) в отрывки, и это сработало как-то. К сожалению, Carrot2 снова выполняет TF-IDF для моих данных, и результаты посредственные. Было бы здорово, если бы я мог передать свои ключевые слова вместе с метриками важности, а затем использовать Carrot2 только для точной настройки результатов.
Я искал такое решение в API, но не смог найти его. Возможно ли это как-то?