Проблема с кодировкой при разборе html / текстового файла, содержащего китайские символы - iOS Цель C - PullRequest
0 голосов
/ 22 февраля 2019

Я работаю с двумя различными типами файлов, которые содержат китайские символы, но я не могу правильно отобразить их в моем приложении для iOS.

Первый - это текстовый файл (файл Packages, поступающий източнее, хранилище apt), которое должно содержать китайские символы, однако из-за проблем с кодировкой на их конце (я считаю), их файл сохраняется со странными символами, такими как:

Name: IGG官方一键新机全息备份
Icon: file:///Applications/IGG.app/IGGAppIcon57x57.png
Description: IGG官方一键新机全息备份

После этого файлаПосле загрузки я анализирую его, создавая словарь для каждого пакета (подразделы, разделенные пустыми строками), и сохраняю всю информацию в своей базе данных, чтобы при необходимости отображать ее в моем приложении.

Первый вопрос: Можно ли преобразовать эти символы в китайские, прежде чем сохранять их в моей базе данных или только когда мне нужно отобразить их?

Вторая часть моегопроблема в том, что мне также нужно скачать HTML-страницу, чтобы проанализировать их и отобразить информацию изначально, а не загружать их в веб-представление.Иногда страница содержит текст на китайском языке, например:

I Got Grimace, 一键新机,全息备份,伪装定位

После загрузки html-файла, если я распечатаю его в консоль следующим образом:

NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];
NSLog(@"myStr : %@", newStr);

Китайские символыотображается правильно, однако после анализа html-страницы с использованием библиотеки HTMLParser / HTMLNode строки возвращаются в странное состояние, подобное этому:

enter image description here

Второй вопрос: Как и раньше, есть ли способ преобразовать эти символы обратно в китайский или, по крайней мере, не преобразовать их при разборе?

Заранее спасибо за помощь и хорошего дня;)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...