Существуют некоторые методы, которые могут получить сходство между текстами, такие как wup_sdentifity () cosine_sdentifity () и т. Д. Моя цель - создать систему ответов на сочинения. Это означает, что я хочу сравнить лист ответов и схему маркировки. До сих пор я выполнял следующие действия, не прибегая к обучению или моделированию.
1. Предварительно обработал оба документа (удалил знаки препинания, выполнил лемматизацию и т. Д.).
2. Далее я получил похожие словас помощью син-наборов word-net и создали два больших массива (схема маркировки с их синонимами и лист ответов с его синонимами) - возможно, это не правильный путь.
3. Затем мне нужно было сравнить эти двабольшие массивы и хотите получить значение сходства
Можете ли вы помочь мне с этим, давая некоторые предложения или ответы. Я знаю, что син-наборы word-net не самые лучшие, потому что это даст несвязанные ответы. Например: животное и транспортное средство будут возвращать 1 в качестве одинаковых значений.
Однако мне нужно найти решения для этого.