Я резюмировал юридический текст на своем родном языке, используя разговорные термины, я также пытался добавить внешние примеры, чтобы прояснить, что включено в этот текст ...
Теперь я хочу использовать искусственный интеллект, чтобы найти близость (сходство) того, что я написал, и оригинальный текст.
Я пытался использовать набор методов, чтобы найти сходство, например:
- Jaccard Сходство
- Различные вложения + косинусное сходство
Однако, когда я сравниваю то, что я написал с оригинальным текстом, я получаю 90% и когда я сравниваю текст из детской книги с исходным текстом, я получаю 70% .
Мне кажется, я не удовлетворен этим результатом. Когда я сравниваю текст из детской книги (не связанной с законом) с исходным текстом, предполагается, что я получаю процент меньше, чем 40% , но этого не произошло!
Есть ли предложение, которое может помочь мне улучшить эти результаты?