У меня нет ответа, но я предоставлю вам отправную точку: китайские символы будут занимать определенные блоки в наборе символов UTF-8. Пример
Вам потребуется запросить строки, содержащие символы между первой и последней точкой этого блока.Хотя я не могу придумать, как это автоматизировать (т. Е. Запросить символы внутри определенного диапазона, не называя каждый символ явно).
Еще одна непроверенная идея, которая приходит на ум, - это использование iconv()
для преобразованияСтрока в специально китайскую кодировку, используя //IGNORE
, и посмотреть, остались ли какие-либо данные.Если что-то осталось, строка может содержать китайские символы .... хотя это, вероятно, будет нарушено любыми числами внутри строки,
Это интересная проблема.