Я смотрю на какой-то существующий фильтр, который может дезинфицировать пользовательский ввод, чтобы избежать XSS. Вероятно, я могу использовать htmlspecialchars для этого. Но в то же время я хочу иметь возможность анализировать все ссылки (должен соответствовать a.com, www.a.com и http://www.a.com, а если это http://www.aaaaaaaaaaaaaaaaaaaaaaaaaa.com, то он должен отображаться как aaa ..a.com), электронные письма и смайлики.
Мне интересно, как лучше это сделать. В настоящее время я использую функцию php с некоторым регулярным выражением, но много раз регулярное выражение просто терпит неудачу (из-за неправильного распознавания ссылки и т. Д.). Я хочу что-то очень похожее на парсер, используемый во время чата Google (даже a.com работает).
Спасибо за ваше время.