Я пытаюсь комментировать документ с помощью RUTA, но не все термины в моем словаре увольняют. Похоже, что таблицы слов могут не читаться правильно или что RETAINTYPE (SPACE) / RETAINTYPE (WS) не работает.
Пример: у меня есть термины «открытый шкаф», «открывает шкаф» и «открывающий шкаф» в формате CSV. Я читаю в терминах RUTA и читаю в соответствующей колонке, но когда я анализирую документ, аннотируется только «открытый счет».
Я пытался использовать RETAINTYPE (SPACE) и RETAINTYPE (WS) для решения проблемы, но безуспешно.
Кроме того, если я добавлю термин «ope cupboard» в мой csv, который читается в моей таблице слов, то «ope cupboard» будет единственной фразой, которая срабатывает, когда я создаю свою аннотацию. Я склонен полагать, что wordtable, возможно, не читает правильно и отфильтровывает эти похожие более длинные фразы, которые начинаются одинаково и заканчиваются одинаково. фраза «открыть дверь» правильно комментирует в том же csv, что и предыдущие термины, но имеет другое окончание. Как только я добавлю «открывает дверь» к тому же CSV, поскольку он не аннотирует «открывает дверь» и будет стрелять только по «открыть дверь»
Фразы, содержащие только одно слово, например: "opencupboard", "openscupboard", запускаются правильно, когда я не использую RETAINTYPE (SPACE) при анализе документа, но мне нужно иметь возможность сохранить пространство из-за другого более короткого фразы, которые вызывают у меня слишком много ложных срабатываний.
Я также воссоздал эту проблему с другими фразами.
По сути, я не могу комментировать леммы.