Я написал приложение для Android для загрузки содержимого HTTP по следующему URL: https://www.forbes.com/celebrities/list/
Я хочу использовать RegEx для извлечения изображения и имени знаменитостей из HTML.Но, к сожалению, HTML-содержимое списка знаменитостей (<tr></tr>
теги) появляется только тогда, когда пользователь «прокручивает».Фактически, моя программа не загружает теги <tr></tr>
внутри тега <tbody>
.
<tbody id="list-table-body">
</tbody>
Как я могу решить эту проблему?
DownloadWebContent Класс:
public class DownloadWebContent extends AsyncTask<String, Void, String> {
@Override
protected String doInBackground(String... urls) {
StringBuilder output = new StringBuilder();
try {
URL url = new URL(urls[0]);
HttpURLConnection httpURLConnection = (HttpURLConnection) url.openConnection();
InputStream inputStream = httpURLConnection.getInputStream();
InputStreamReader inputStreamReader = new InputStreamReader(inputStream);
int read = inputStreamReader.read();
while (read != -1) {
char character = (char) read;
output.append(character);
read = inputStreamReader.read();
}
return output.toString();
} catch (Exception e) {
Log.i("HTML_Error", e.getMessage());
return "Failed!";
}
}
}
Метод создания:
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
TextView textView = findViewById(R.id.textView);
DownloadWebContent downloadWebContent = new DownloadWebContent();
try {
String htmlContent = downloadWebContent.execute("https://www.forbes.com/celebrities/list/").get();
String htmlContentReplaced= htmlContent.replace("\"", "");
textView.setText(htmlContentReplaced);
} catch (Exception e) {
e.printStackTrace();
}
}