Я делаю систему распознавания номерных знаков, у меня есть основополагающая правда изображения, которое оно содержит из нескольких номерных знаков, чтобы я мог знать его идентификатор, но без информации о местоположении. Так что я делаю списокИдентификаторы прогнозируемых номерных знаков и попытайтесь сравнить их с наземными номерными знаками правды, чтобы узнать, какой символ мне не хватает. Прежде чем начинать сравнение, мне нужно отсортировать прогнозируемые номерные знаки, чтобы сравнить с правильной наземной истинностью. Иногда прогнозируемый номерной знак можетбыть полностью неправым, если это только похоже на номерной знак. Так что я пытаюсь использовать коэффициент Левенштейна, чтобы решить, так это или нет. Кратко опишите проблему:
lps_gt = ['ABC-1234', 'HK-5566']#ground truth
lps_prd = ['LABC123', '111']#prediction
for i in range(len(lps_gt)):
for j in range(len(lps_prd)):
ratio[i][j] = lvst.ratio(lps_gt[i], lps_prd[j])
res = np.argmax(ratio, axis = 1)
for i in range(len(lps_gt)):
if (ratio[i][res[i]] > 0.5):
sorted_lps_prd.append(lps_prd[res[i]])
sorted_fmts.append(fmts[res[i]])
Я хочу найти порог отношения Левенштейна, чтобы избавиться от чего-то вроде «111», поэтому «111» не будет сравниваться с «HK-5566» 0,5что я использую сейчас, но я не уверен, что это адекватно или нет. Поскольку я использую py-levenshtein, я пробую Jaro и Jaro_Winkler, но оба они слишком сильно заботятся о голове.