HtmlCleaner возвращает "???"при разборе неанглийского веб-сайта - PullRequest
2 голосов
/ 22 июля 2011

Когда я пытаюсь разобрать такие сайты, как Google или Apple с HtmlCleaner , все идет хорошо.Но когда я пытаюсь разобрать китайский веб-сайт, текст выглядит так: «???».

Что вызывает эту проблему и как ее решить?

1 Ответ

2 голосов
/ 22 июля 2011

проблема кодировки символов. Вам нужно установить кодировку на основе содержимого, прежде чем что-либо делать с содержимым.

...