У меня есть набор текстовых файлов, которые были закодированы в UTF-8
.Текст внутри файлов выглядит следующим образом: \x6c\x69b/\x62\x2f\x6d\x69nd/m\x61x\x2e\x70h\x70
.
Я скопировал все эти текстовые файлы и поместил их в каталог /convert/
.
Мне нужно прочитать каждый файл ипреобразовать закодированные литералы в символы, затем сохранить файл.filename.converted.txt
Каким был бы самый разумный подход для этого?Что я могу сделать, чтобы преобразовать в новый текст?Есть ли функция для обработки текста Unicode для преобразования между литералом в символьные типы?Должен ли я использовать для этого другой язык программирования?
Это то, что у меня есть в данный момент:
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
public class decode {
public static void main(String args[]) {
File directory = new File("C:/convert/");
String[] files = directory.list();
boolean success = false;
for (String file : files) {
System.out.println("Processing \"" + file + "\"");
//TODO read each file and convert them into characters
success = true;
if (success) {
System.out.println("Successfully converted \"" + file + "\"");
} else {
System.out.println("Failed to convert \"" + file + "\"");
}
//save file
if (success) {
try {
FileWriter open = new FileWriter("C:/convert/" + file + ".converted.txt");
BufferedWriter write = new BufferedWriter(open);
write.write("TODO: write converted text into file");
write.close();
System.out.println("Successfully saved \"" + file + "\" conversion.");
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
}