Я использую Watson Knowledge Studio для анализа резюме.Когда я загружаю документ, Watson запускает определение границы предложения.Тем не менее, резюме не совсем как естественный язык, такой как электронные письма или комментарии, и имеет меньше знаков препинания.Поэтому обнаружение границ предложений может с треском провалиться, и разбить токены, которые должны находиться в пределах одного объекта на нескольких строках.
Чтобы решить эту проблему, я создал собственную модель для обнаружения предложений в резюме.Теперь я хотел бы загрузить документ в Watson, не позволяя ему пытаться заново сегментировать предложения.Наилучший подход, которым я руководствуюсь, состоит в том, что каждый раз, когда моя модель предсказывает разрыв предложения, ставится разрыв двух строк.Благодаря этому Уотсон никогда не объединяет разные предложения.Однако иногда он считает, что разрыв предложения отсутствует, и добавляет новый.
Как отключить обнаружение границ предложений в Watson Knowledge Studio?