Как установить порог Левенштейна? - PullRequest
0 голосов
/ 15 октября 2019

Я делаю систему распознавания номерных знаков, у меня есть основополагающая правда изображения, которое оно содержит из нескольких номерных знаков, чтобы я мог знать его идентификатор, но без информации о местоположении. Так что я делаю списокИдентификаторы прогнозируемых номерных знаков и попытайтесь сравнить их с наземными номерными знаками правды, чтобы узнать, какой символ мне не хватает. Прежде чем начинать сравнение, мне нужно отсортировать прогнозируемые номерные знаки, чтобы сравнить с правильной наземной истинностью. Иногда прогнозируемый номерной знак можетбыть полностью неправым, если это только похоже на номерной знак. Так что я пытаюсь использовать коэффициент Левенштейна, чтобы решить, так это или нет. Кратко опишите проблему:

lps_gt = ['ABC-1234', 'HK-5566']#ground truth
lps_prd = ['LABC123', '111']#prediction
for i in range(len(lps_gt)):
    for j in range(len(lps_prd)):
        ratio[i][j] = lvst.ratio(lps_gt[i], lps_prd[j])

res = np.argmax(ratio, axis = 1)
for i in range(len(lps_gt)):
    if (ratio[i][res[i]] > 0.5):
        sorted_lps_prd.append(lps_prd[res[i]])
        sorted_fmts.append(fmts[res[i]])

Я хочу найти порог отношения Левенштейна, чтобы избавиться от чего-то вроде «111», поэтому «111» не будет сравниваться с «HK-5566» 0,5что я использую сейчас, но я не уверен, что это адекватно или нет. Поскольку я использую py-levenshtein, я пробую Jaro и Jaro_Winkler, но оба они слишком сильно заботятся о голове.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...