Сменные буквы - PullRequest
       12

Сменные буквы

0 голосов
/ 09 января 2012

Как вы, наверное, знаете, в латинском алфавите не было разницы между u / v и i / j. Это очень поздняя традиция отделять эти буквы, и многие латинские тексты не имеют такого разделения. Следуя этой традиции, я решил предоставить пользователям моего маленького словаря возможность находить слова, не относящиеся к буквам u / v и i / j. Например, введя «adjuvo», «adiuvo», «adjuuo» и т. Д., Пользователь получит тот же результат. Какой лучший способ достичь этого? Например, у меня есть список слов. Как я могу получить все слова, чтобы Python не отличался u / v и i / j? Большое спасибо!

1 Ответ

6 голосов
/ 09 января 2012

Канонизируйте строки перед сопоставлением. замените все буквы v на u, а все j на i. В словаре сохраните отображение из каждой канонической формы во все соответствующие неканонические формы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...