Я экспериментирую с устранением неоднозначности имен и до сих пор пытался использовать сокращение имен для получения частичных совпадений.Мне было интересно, есть ли какие-либо методы ML, которые я могу использовать, чтобы сравнить мои результаты.Я нашел много информации об устранении неоднозначности имени автора, но большинство из них являются контролируемыми методами.Вот образец моих данных:
Names
0 Michaele Frendu
1 Lucam Zamit
2 Johanne Luckys
3 Albano Fava
4 Augustino Bagliu
5 Lucas Zamit
6 Micheli Frendu
7 Luce
8 Far
9 Petro Calleya
10 Petrj
11 Marie
12 Michaele
13 Bartholomeus Gaudixj
14 Matheus de Vassaldo
15 Johannes Zurki
16 Michael