Я создаю простое веб-приложение для форума. Я хочу разрешить пользователям включать html в свои сообщения, но хотел бы прекратить любые межсайтовые сценарии. Моя текущая стратегия заключается в том, чтобы не разрешать какие-либо теги «script», разрешать только атрибуты «style» и «href» для любого тега и не позволять значениям «href» начинаться с «javascript:». Я что-то упускаю?
ОБНОВЛЕНИЕ : я решил эту проблему с помощью "белого списка" html-элементов. Когда недопустимые элементы найдены, я удаляю тег, но оставляю внутренний html. Это решает проблему людей, копирующих и вставляющих из документа MS Word. Я также изучил antisamy.net , но столкнулся с некоторыми проблемами, связанными с обработкой атрибутов стиля на отрезках (т. Е. Их удалением). Если мне удастся это решить, я могу переключиться на это решение.