- это HTML объект, который обозначает неразрывный пробел . Поэтому, когда вы получите текстовое содержимое, оно не будет содержать
. Вместо этого он будет содержать неразрывный пробел. Я думаю, консоль не знает, как отобразить этот символ, поэтому она просто выводит ?
.
Если вы хотите избавиться от него, вы можете заменить его на простой пробел:
head = head.Replace("\u00A0", " ");
00A0
- это код Unicode для символа неразрывного пробела.
Будьте осторожны, если вы намерены делать больше с текстом, чем просто отображать его в консоли или выполнять некоторые простые манипуляции. Обычно для этого есть неразрывный пробел, поскольку он запрещает перенос текста между словами. Например, 100 км не следует заключать между 100 и км .