Существует код Python, доступный для обычных алгоритмов поиска строк, таких как Бойер-Мур. Я хочу использовать это на китайских иероглифах, но не похоже, что такая же реализация будет работать. Что бы я сделал, чтобы алгоритм работал с китайскими символами? Я имею в виду это:
http://en.literateprograms.org/Boyer-Moore_string_search_algorithm_(Python)#References
Пока весь ваш текст в юникоде, он должен работать нормально. Алгоритм выглядит независимым от последовательности при условии, что каждый «элемент» имеет одну единицу последовательности в длину.