Я занимаюсь веб-очисткой, и я получаю json-файл от скребка, проблема в том, что для любого языка, кроме английского, записывается фактический идентификатор символа Unicode, например:
, в нем будет храниться
פלסטינים
вместо
םויסלפנ
Что я хочу сделать, это ввести строку, в которой хранятся идентификаторы символов + английский текст + объекты HTML, и заменить каждый идентификатор Unicode ID / HTML на код Unicode.символ, который подходит емуКто-нибудь знает метод, который может помочь мне с задачей?Использование .NET ASP.NET JSON.NET IronWebScraper
- немного новый для stackoverflow
Редактировать: пример кода
using (StreamReader r = new StreamReader(AppDomain.CurrentDomain.BaseDirectory + @"DataBase\net\net.jsonl"))
{
string json = r.ReadToEnd();
List<string> items = JsonConvert.DeserializeObject<List<string>>(json);
foreach (var str in items)
Logger.Log(WebUtility.HtmlDecode(str));
}