Я поддерживаю веб-сайт, написанный на Tcl, который отображает данные на традиционном китайском (big5). Затем у нас есть Java-сервлет, использующий код перевода с сайта mandarintools.com, для перевода запроса страницы на упрощенный китайский. Преобразование, как указано в коде перевода, происходит из UTF-8 в UTF-8S; Java, по-видимому, правильно переводит данные в UTF-8 по мере поступления.
Код для перевода на Java работает, но работает медленно, и, поскольку сайт написан на Tcl, кто-то из другого списка предложил мне попробовать это. К сожалению, Tcl не поддерживает UTF-8S, и я не смог понять, какой перевод использовать вместо него. Я пробовал gb2312, gb2312-raw, gb1988, euc-cn ... все приводит к бреду. Я предполагаю, что Tcl также переводит на UTF-8 по мере поступления, хотя я сначала попытался конвертировать из big5, и это не помогает.
Мой тестовый код выглядит так:
set page_body [ns_httpget http://www.mysite.com]
set translated_page_body [encoding convertto gb2312 $page_body]
ns_write $translated_page_body
я тоже пробовал
set page_body [ns_httpget http://www.mysite.com]
set translated_page_body [encoding convertto gb2312 [encoding convertfrom big5 $page_body]]
ns_write $translated_page_body
Но это ничего не изменило.
У кого-нибудь есть достаточно опыта, чтобы помочь мне разобраться?