Я очищаю социальную платформу, используя селен, и многие пользователи используют специальные символы, такие как HEᑕƘᏔ®✞ℍ
, огонь Emojis и так далее. Эти символы превращаются в знаки вопроса, такие как "HE?????????
".
Я пытался использовать утилиты декодирования и кодирования, но мне абсолютно не повезло. См. Здесь:
WebUtility.HtmlDecode(string);
WebUtility.HtmlEncode(string);
У меня такое ощущение, что я здесь неправильно лаю, но понятия не имею, с чего начать, так как ответы специальных персонажей обычно говорят о Юникоде, и я уверен, что это в данном случае не имеет значения.
РЕДАКТИРОВАТЬ: Вот как я выбираю содержимое с использованием селена
title = driver.FindElement(By.XPath("//*[@id=\"header-
section\"]/div[2]/div/div/div/div/div[1]/div/h1")).Text;