Question

Я получаю вероятность того, что строка похожа на другую строку в Python, используя fuzzywuzzy lib.

В настоящее время я делаю это с помощью цикла for, и поиск занимает много времени.

Ниже приведен рабочий код:

from fuzzywuzzy import fuzz

with open('all_nut_data.csv', newline='') as csvfile:
   spamwriter = csv.DictReader(csvfile)
   mostsimilarcs = 0
   mostsimilarns = 0
   for rowdata in spamwriter:
       mostsimilarns = fuzz.ratio(rowdata["Food Item"].lower(), name.lower())
       if mostsimilarns > mostsimilarcs:
           mostsimilarcs = mostsimilarns
           row1 = rowdata

Как я могу оптимизировать этот код без цикла?

Примечание * Файл CSV содержит 600 000 строк и 17 столбцов

Как оптимизировать цикл for для поиска подходящей 2 строки с помощью fuzzywuzzy

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как оптимизировать цикл for для поиска подходящей 2 строки с помощью fuzzywuzzy

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы