проверять ввод на UTF-8, считать символы, использовать регулярные выражения - PullRequest
1 голос
/ 19 октября 2010

Я хочу написать C-программу, которая получает некоторые строки из ввода.Я хочу сохранить их в базе данных MySQL.В целях безопасности я хотел бы проверить, является ли ввод (возможно) строкой UTF-8, подсчитать количество символов, а также использовать некоторые регулярные выражения для проверки ввода.

Есть ли библиотека, которая предлагает мнеэта функциональность?

Я думал об использовании широких символов, но, насколько я понял, тот факт, что они поддерживают UTF-8, зависит от реализации и не определяется стандартом.А также мне не хватало бы регулярных выражений.

1 Ответ

1 голос
/ 19 октября 2010

PCRE поддерживает UTF-8.Чтобы проверить строку перед любой обработкой, W3C предлагает это выражение , которое я повторно реализовал в простом C , но PCRE уже автоматически проверяет UTF-8 в соответствии с RFC 3629.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...