Я пытаюсь отследить проблему.Вот что у меня уже есть:
Есть Exists.java
:
import java.io.*;
public class Exists {
public static void main(String[] args) {
new File("aaa").exists();
new File("aaa\u00E4").exists();
new File("aaa\u00C3\u00A4").exists();
}
}
И есть java -version
:
java version "1.6.0_20"
Java(TM) SE Runtime Environment (build 1.6.0_20-b02)
Java HotSpot(TM) 64-Bit Server VM (build 16.3-b01, mixed mode)
Теперь по интересной части:
$ strace -f -o strace.out java Exists && grep 'stat("aaa' strace.out
31942 stat("aaa", 0x41464950) = -1 ENOENT (No such file or directory)
31942 stat("aaa\303\244", 0x41464950) = -1 ENOENT (No such file or directory)
31942 stat("aaa\303\203\302\244", 0x41464950) = -1 ENOENT (No such file or directory)
Приятно то, что strace
работает на уровне байтов, а не на уровне символов, как Java.Так что в этом случае все нормально.У меня переменная окружения LANG
установлена на en_US.UTF-8
, все переменные LC_*
не установлены.
Теперь отслеживание проблемы до минимального рабочего примера:
$ strace -f -o strace.out env - LC_ALL=en_US.UTF-8 /home/roland/bin/java Exists && grep 'stat("aaa' strace.out
31968 stat("aaa", 0x41a75950) = -1 ENOENT (No such file or directory)
31968 stat("aaa\303\244", 0x41a75950) = -1 ENOENT (No such file or directory)
31968 stat("aaa\303\203\302\244", 0x41a75950) = -1 ENOENT (No such file or directory)
Это все еще работает.Итак, давайте попробуем другую кодировку:
$ strace -f -o strace.out env - LANG=en_US.ISO-8859-1 /home/roland/bin/java Exists && grep 'stat("aaa' strace.out
32070 stat("aaa", 0x407a3950) = -1 ENOENT (No such file or directory)
32070 stat("aaa?", 0x407a3950) = -1 ENOENT (No such file or directory)
32070 stat("aaa??", 0x407a3950) = -1 ENOENT (No such file or directory)
Так что это не работает.Одной из возможных причин может быть то, что я выбрал локаль, которой нет в списке, напечатанном locale -a
.Но это не должно быть причиной того, что Java преобразует буквы в вопросительные знаки.
Как только LANG указывает на несуществующий языковой стандарт, настройка свойства sun.jnu.encoding
не оказывает никакого влияния.больше.Так что у меня сейчас нет идей.