У меня была похожая проблема с текстом на иврите.Я обнаружил, что это вызвано кодировкой по умолчанию.
Чтобы проверить кодировку по умолчанию, я использовал этот код:
OutputStreamWriter out = new OutputStreamWriter(new ByteArrayOutputStream());
String encoding = out.getEncoding();
На моем компьютере кодировка "UTF8".На сервере GAE это «ASCII».
Я решил проблему, заменив все программы чтения файлов в моем коде:
new InputStreamReader(new FileInputStream(file), "UTF8"));
Это говорит Java игнорировать кодировку по умолчанию,и откройте все входные файлы как UTF8.