Я пытаюсь найти похожие статьи в базе данных через корреляцию.
Итак, я разбил текст на массив слов, затем удалил часто используемые слова (статьи, местоимения и т. Д.), Затем сравнил два текста с помощью коэффициента Пирсона. Для одного текста это работает, но для другого это не так хорошо (тексты с большим текстом имеют более высокий коэффициент).
Может кто-нибудь посоветовать хороший метод для поиска похожих текстов?