улучшить скорость запуска двух циклов в даталабе - PullRequest
0 голосов
/ 16 ноября 2018

Я хочу сравнить два списка строк и вернуть оценку сходства каждого сравнения в datalab. Однако запуск кода занимает много времени. Есть ли идеи, которые я могу улучшить скорость бега? Я использую fuzzywuzzy для сравнения строк, и ниже приведен пример кода. Длина list1 равна 34323, а длина list2 равна 49057.

`for j in range(1,len(list1)):         
print(j)
str1=str(list1.iloc[j]['Q_NoProductClick'])
print(str1)
for l in range(1,len(list2)):
  #print(l)
  str2=str(list2.iloc[l]['Q_ClickedProd'])
  #print(str2)
  a=fuzz.ratio(str1,str2)`
...