Я сканирую веб-страницы с разных сайтов, и они имеют разные кодировки.Образец кодировок, которые я получаю, -
- Big5
- TIS-620
- utf-16le
- shift_JIS
- EUC-JP
- MacCyrillic
- koi8-r
, за исключением более распространенных кодировок.Я могу получить исходный код Unicode для веб-страницы путем декодирования с использованием вышеуказанных кодировок.
У меня такой вопрос: я хотел бы сохранить все файлы как utf8.Если я закодирую исходный код Unicode с помощью utf8, будет ли он работать на всех веб-страницах?Поддерживает ли utf8 все кодовые точки Unicode?