Проблема с кодировкой HTML-файла (китайский) - PullRequest
0 голосов
/ 11 ноября 2018

У меня есть HTML-файл, который содержит некоторые записи, показанные в таблице, которые каким-то образом неправильно закодированы. Большая часть файла является правильной и показывает содержимое, как и ожидалось, но некоторые части файла, похоже, закодированы неправильно. На самом деле вся HTML-часть отображается правильно (все элементы и т. Д.), Но значения в ячейках таблицы иногда кодируются неправильно. Например, одна ячейка содержит:

<cell>»¿è²å¼æäºæ 线æ¥å¥ç½ç»ä¸­çæ³¢ææå½¢ææ¯ç 究</cell>

Пока он должен содержать:

<cell>绿色异构云无线接入网络中的波束成形技术研究</cell>

Я уже пытался выяснить, что именно пошло не так, но я не могу найти правильное решение, чтобы полностью решить эту проблему для всего файла. Я пробовал такие инструменты, как FTFY, который не дал мне никакого значимого результата.

Эти веб-сайты дали мне некоторое указание, и кажется, что что-то пошло не так между Windows-1252/1251 и UTF-8. Первый веб-сайт, похоже, решает проблему, но все еще возвращает некоторые неизвестные символы (UTF-8 отображается как Windows-1252).

У кого-нибудь есть идеи, как это исправить для всего файла? Или дайте мне какие-нибудь советы, чтобы я сам все понял.

Заранее спасибо.

...