Хороший вопрос. Я не знал, что существуют недопустимые последовательности UTF-8.
Статья в Википедии - отправная точка, но я не думаю, что вы можете пройти полный тест. Ты можешь? Я заинтересован
Полный тест означает, что для каждой последовательности у вас может быть функция, которая отвечает да или нет для каждой возможной последовательности. Полная функция.
Смысл в том, что делать или возвращать, если ваша последовательность не завершена (короткая последовательность). Насколько я знаю, есть некоторые редакторы, которые добавляют специальный символ для его выполнения. Возможно, вам следует обработать такие случаи как недопустимые последовательности, и тогда ваш тест будет завершен.
Интересно, это единственный случай?
Во всяком случае, я буду ставить этот вопрос в качестве фаворита, чтобы отслеживать ответы. Конечно, кто-то осветит нас.