У меня есть список фраз, на самом деле это файл Excel, но при необходимости я могу извлечь каждую строку. Мне нужно найти строку, которая очень похожа, например, одна строка может быть:
ANTIBRATING SSPIRING JOINT (type 2) mod. GA160 (temp.max60°)
и какая-то строка после того, как у меня может быть такая же строка, или эта:
ANTIBRATING SSPIRING JOINT (type 2) mod. GA200 (temp.max60°)
Как вы можете видеть, эти две строки практически одинаковы, в данном случае не равны, но на 98%. Основная проблема в том, что мне нужно обработать около 45 тыс. Строк, по этой причине я ищу способ сделать это быстро. а может и визуальным способом. Первое, что пришло мне в голову, это сравнить самую первую строку со второй, затем третью до конца, и так далее со второй и третьей до последней-1 и сделать что-то вроде оценки, например 1-я строка - 100% с строкой 42, 99% с строкой 522 ... 21% с строкой 22142 et c et c ... Но это только одна идея, возможно, не самая лучшая.
Может быть, уже есть хорошая программа / скрипт / онлайн-сервисы / программа, я искал, но не могу ее найти, поэтому в конце я спросил здесь.
Кто-нибудь знает хороший способ (если это возможно) или скрипт или один онлайн-сервис для этого?