Алгоритм поиска строк для китайских иероглифов - PullRequest
2 голосов
/ 24 марта 2010

Существует код Python, доступный для обычных алгоритмов поиска строк, таких как Бойер-Мур. Я хочу использовать это на китайских иероглифах, но не похоже, что такая же реализация будет работать. Что бы я сделал, чтобы алгоритм работал с китайскими символами? Я имею в виду это:

http://en.literateprograms.org/Boyer-Moore_string_search_algorithm_(Python)#References

1 Ответ

3 голосов
/ 24 марта 2010

Пока весь ваш текст в юникоде, он должен работать нормально. Алгоритм выглядит независимым от последовательности при условии, что каждый «элемент» имеет одну единицу последовательности в длину.

...