Кодировка символов для тайских символов - PullRequest
1 голос
/ 30 июля 2009

У меня есть требование прочитать RTF-файл с тайскими символами и записать его в текстовый файл. Я попытался использовать TIS-620, MS874, ISO-8859-11, но тайские символы не отображаются должным образом, когда я открываю полученный выходной файл в блокноте или текстовом блокноте. Но это хорошо работает с Wordpad. Пожалуйста, ведите меня.

Спасибо и С уважением, Ramya.

Код, который решил проблему (оставил комментарий, добавив сюда, чтобы сделать его читабельным!):

FileInputStream fin = new FileInputStream(fileName);
DataInputStream din = new DataInputStream(fin);
//creating a default blank styled document
DefaultStyledDocument styledDoc = new DefaultStyledDocument();
//Creating a RTF Editor kit
RTFEditorKit rtfKit = new RTFEditorKit();
//Populating the contents in the blank styled document
rtfKit.read(din,styledDoc,0);
// Getting the root document
Document doc = styledDoc.getDefaultRootElement().getDocument();
//Printing out the contents of the RTF document as plain text
System.out.println(doc.getText(0,doc.getLength())); 

1 Ответ

0 голосов
/ 30 июля 2009

Я не думаю, что блокнот обрабатывает все кодировки символов, от небольшого поиска в Google. Не могли бы вы попытаться перекодировать символы в UTF-8 (или какой-либо другой формат Unicode), поскольку Notepad справляется с этим правильно? Вы захотите использовать спецификацию .

Я также наткнулся на инструмент для преобразования файлов на тайском в различные другие кодировки.

Наконец, существует ли требование, что файлы могут быть открыты в Блокноте? Это не так, как будто Блокнот - последнее слово в редактировании текста.

...