У меня есть японский контент, который конвертируется в MS-справку с помощью определенного инструмента.Проблема в том, что сторонний инструмент не использует кодировку utf-8 и создает .xml с символами мусора:
<param name="Name" value="ÉAÉvÉäÉPÅÉVÉáÉìdžÇ'ÇËÇØÅǵÇÃ'ÇÃ']">
<param name="Name" value="Test File">
<param name="Local" value="applications.htm#Xau1044547">
Я попытался поиграться с кодировкой, и теперь он выдает:
<param name="Name" value="ÉAÉvÉäÉPÅ">
<param name="Name" value="Test">
<param name="Local" value="applications.htm#Xau1044547">
Но с кодировкой utf-8 (другой инструмент) и правильным выводом должно быть:
<param name="Name" value="アプリケーション">
<param name="Name" value="Small Business アプリケーションの起動 ">
<param name="Local" value="applications1.html#wp1044548">
Есть ли какой-нибудь java API, который я могу использовать для декодирования и кодирования файлов, чтобы иметь правильныйвыход.Я не уверен, что инструмент использует, но я предполагаю, что это «ISO-8859-1».
Спасибо.