Когда я пытаюсь разобрать такие сайты, как Google или Apple с HtmlCleaner , все идет хорошо.Но когда я пытаюсь разобрать китайский веб-сайт, текст выглядит так: «???».
Что вызывает эту проблему и как ее решить?
проблема кодировки символов. Вам нужно установить кодировку на основе содержимого, прежде чем что-либо делать с содержимым.