Как показать японские символы в Mac OS X Terminal? - PullRequest
2 голосов
/ 04 мая 2011

Итак, я запускаю MeCab (http://mecab.sourceforge.net/#download) для словарного сегмента и выполняю морфоанализ японских предложений. Однако, когда я запускаю программу, я вижу абракадабру из-за некоторых проблем с кодированием в Mac OS X Terminal. Я гуглил В теме добавлена ​​опция Dfile.encoding, добавлены следующие 3 строки в .inputrc:

set convert-meta off
set meta-flag on
set output-meta on

Ничего не работает. Есть идеи, как показать японские символы в Mac OS X Terminal? Вот вывод прогона программы test.java:

env DYLD_LIBRARY_PATH=. /usr/bin/java -Dfile.encoding=utf-8 test
0.98pre3
å¤  ̾»ì,°ìÈÌ,*,*,*,*,*
ª郎ã µ­¹æ,°ìÈÌ,*,*,*,*,*
¯ä  ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*,*,*
º郎にこのæ  µ­¹æ,°ìÈÌ,*,*,*,*,*
¬ã  ̾»ì,¥µÊÑÀܳ,*,*,*,*,*
    µ­¹æ,°ìÈÌ,*,*,*,*,*
æ¸  ̾»ì,°ìÈÌ,*,*,*,*,*
¡ã  µ­¹æ,³ç
    BOS/EOS,*,*,*,*,*,*,*,*
å   ̾»ì,°ìÈÌ,*,*,*,*
ª郎  µ­¹æ,°ìÈÌ,*,*,*
¯   ̾»ì,¸Çͭ̾»ì,Áȿ¥,*,*
º郎にこ    µ­¹æ,°ìÈÌ,*,*,*
¬   ̾»ì,¥µÊÑÀܳ,*,*,*,
    µ­¹æ,°ìÈÌ,*,*,*
æ   ̾»ì,°ìÈÌ,*,*,*,*
¡   µ­¹æ,³ç¸̳«,*,*,*,*
    µ­¹æ,°ìÈÌ,*,*,*
    BOS/EOS,*,*,*,*,*,*,*,*
EOS

Ответы [ 2 ]

1 голос
/ 04 мая 2011

Я бы подумал, что это настройка по умолчанию, но вы можете попробовать выбрать «Юникод (UTF-8)» в качестве кодировки символов из Предпочтения ... , Настройки Продвинутый , Международный .Если это уже установлено, вы можете подтвердить, что выходные данные вашей программы действительно закодированы в UTF-8.Это может быть Shift-JIS, EUC или даже UTF-16?В этом случае попробуйте включить эти кодировки из Настройки ... , Кодировки .

0 голосов
/ 04 мая 2011

После этого

% cd mecab-ipadic-2.7.0-xxxx
% ./configure --with-charset=utf8
% sudo make
% sudo make install

вывод 'mecab -D' равен

% cd mecab-java-0.98pre3
% mecab -D
filename:    /usr/local/lib/mecab/dic/ipadic/sys.dic
version:    102
charset:    utf8
type:    0
size:    392126
left size:    1316
right size:    1316

Вот результат запуска тестовой программы.

bash-3.2$ env DYLD_LIBRARY_PATH=. /usr/bin/java test
0.98pre3
??    ??,????,??,?,*,*,??,???,???
?    ??,???,*,*,*,*,?,?,?
??    ??,????,??,?,*,*,??,???,???
?    ??,???,??,*,*,*,?,?,?
??    ???,*,*,*,*,*,??,??,??
?    ??,??,*,*,*,*,?,??,??
?    ??,???,??,*,*,*,?,?,?
??    ??,??,*,*,?????,???,??,???,???
?    ???,*,*,*,????,???,?,?,?
?    ??,??,*,*,*,*,?,?,?
EOS

    BOS/EOS,*,*,*,*,*,*,*,*
??    ??,????,??,?,*,*,??,???,???
?    ??,???,*,*,*,*,?,?,?
??    ??,????,??,?,*,*,??,???,???
?    ??,???,??,*,*,*,?,?,?
??    ???,*,*,*,*,*,??,??,??
?    ??,??,*,*,*,*,?,??,??
?    ??,???,??,*,*,*,?,?,?
??    ??,??,*,*,?????,???,??,???,???
?    ???,*,*,*,????,???,?,?,?
?    ??,??,*,*,*,*,?,?,?
    BOS/EOS,*,*,*,*,*,*,*,*
EOS

Чего мне не хватает, чтобы кодирование работало?

P / S: все японские кодировки включены в Предпочтения - Кодировки в Терминале, кодировка (Настройки - Настройки - Дополнительно - Международные) в Mac OS X Терминал - UTF-8.

...