Как можно найти похожий процент между моей речью и чем-то написанным - PullRequest
0 голосов
/ 15 января 2020

Я резюмировал юридический текст на своем родном языке, используя разговорные термины, я также пытался добавить внешние примеры, чтобы прояснить, что включено в этот текст ...

Теперь я хочу использовать искусственный интеллект, чтобы найти близость (сходство) того, что я написал, и оригинальный текст.

Я пытался использовать набор методов, чтобы найти сходство, например:

  • Jaccard Сходство
  • Различные вложения + косинусное сходство

Однако, когда я сравниваю то, что я написал с оригинальным текстом, я получаю 90% и когда я сравниваю текст из детской книги с исходным текстом, я получаю 70% .

Мне кажется, я не удовлетворен этим результатом. Когда я сравниваю текст из детской книги (не связанной с законом) с исходным текстом, предполагается, что я получаю процент меньше, чем 40% , но этого не произошло!

Есть ли предложение, которое может помочь мне улучшить эти результаты?

...