Я создаю библиотеку регулярных выражений для работы с HTML (когда это будет сделано, я опубликую ее в коде MSDN). Один из методов удаляет все пробелы перед закрывающим тегом.
<p>See the dog run </p>
Это устранит пробел перед заключительным абзацем. Я использую это:
public static string RemoveWhiteSpaceBeforeClosingTag(string text)
{
string pattern = @"(\s+)(?:</)";
return Regex.Replace(text, pattern, "</", Singleline | IgnoreCase);
}
Как вы можете видеть, я заменяю пробелы на </, так как я не могу соответствовать только пробелу и исключить закрывающий тег Я знаю, что есть выход - я просто не понял этого. </p>