Я просто хочу получить исходный код веб-страницы на языке Java, и я просто хочу получить этот контент с правильным типом кодировки. Я могу получить содержимое веб-страницы до сих пор. Но для некоторых веб-страниц контент содержит нелепые символы. Поэтому мне нужно определить кодировку этой веб-страницы.
Согласно моим небольшим исследованиям, я обнаружил, что для этого есть библиотека jChardet. Но я не смог импортировать его в свой проект. Может кто-нибудь помочь мне?
Кстати, код ниже - это код для чтения содержимого веб-страницы
StringBuilder builder = new StringBuilder();
InputStream is = fURL.openStream();
BufferedReader buffer = null;
buffer = new BufferedReader(new InputStreamReader(is, encodingType));
int byteRead;
while ((byteRead = buffer.read()) != -1) {
builder.append((char) byteRead);
}
buffer.close();
return builder;