Преобразование неанглийского текста в читаемый формат - PullRequest
0 голосов
/ 30 августа 2010

Я получаю из Интернета строки, которые часто содержат акцентированные символы, не распознаваемые в моем приложении.

Редактировать - Я получаю свою строку, используя HtmlAgilityPack. Я беру InnerText тега <title>. При этом в пакете используется другая кодировка, чем в оригинальном HTML-документе (хотя я не уверен, какая именно?)

        // get the html title inner text and assign to htmlParts object
        HtmlNode titleNode = doc.DocumentNode.SelectSingleNode("//title");
        string docTitle = titleNode.InnerText;
        htmlParts.htmlTitle = docTitle.ToString();

Может кто-нибудь сказать мне, как я могу получить от "(Subtitulado al español).avi" до "(Subtitulado al español).avi"?

Я бы очень признателен за это. :)

Ответы [ 2 ]

2 голосов
/ 30 августа 2010

Похоже, вы получаете UTF-8, но обрабатываете его как ISO-8859-1.

Невозможно дать более конкретную информацию, не зная больше о вашей системе.

0 голосов
/ 30 августа 2010

применять правильную кодировку к прочитанным данным.Как именно?Хороший вопрос.Для этого вам по крайней мере необходимо предоставить код, который в первую очередь вызывает проблему.

...