Я получаю вероятность того, что строка похожа на другую строку в Python, используя fuzzywuzzy
lib.
В настоящее время я делаю это с помощью цикла for, и поиск занимает много времени.
Ниже приведен рабочий код:
from fuzzywuzzy import fuzz
with open('all_nut_data.csv', newline='') as csvfile:
spamwriter = csv.DictReader(csvfile)
mostsimilarcs = 0
mostsimilarns = 0
for rowdata in spamwriter:
mostsimilarns = fuzz.ratio(rowdata["Food Item"].lower(), name.lower())
if mostsimilarns > mostsimilarcs:
mostsimilarcs = mostsimilarns
row1 = rowdata
Как я могу оптимизировать этот код без цикла?
Примечание * Файл CSV содержит 600 000 строк и 17 столбцов