У меня есть сайт, где пользователи могут публиковать материалы (например, на форумах, в комментариях и т. Д.), Используя индивидуальную реализацию TinyMCE. Многим из них нравится копировать и вставлять из Word, что означает, что их ввод часто сопровождается множеством встроенного форматирования MS.
Я не могу просто избавиться от <span whatever>
, так как TinyMCE использует тег span для некоторых форматов, и я не могу (и не хочу) заставлять указанных пользователей использовать "Вставить из Word" TinyMCE "функция (которая в любом случае не очень хорошо работает).
Кто-нибудь знает библиотеку / класс / функцию, которая позаботится об этом для меня? Должно быть, это общая проблема, хотя я не могу найти ничего определенного. Недавно я подумал, что ряд регулярных выражений грубой силы, ищущих паттерны, специфичные для MS, могут сработать, но я не хочу переписывать то, что уже может быть доступно, если я не должен.
Кроме того, исправление фигурных кавычек, тире и т. Д. Было бы хорошо. У меня есть свои собственные вещи, чтобы сделать это сейчас, но я действительно хотел бы найти один фильтр MS-преобразования, чтобы управлять ими всеми.