Чтение текста из профиля Instagram - PullRequest
0 голосов
/ 12 июля 2020

Вопрос в том, как читать текст из профиля Instagram, если пользователь вводит URL-адрес Instagram. Я пробовал использовать java. net .URL, и все, что я получил, это большая загрузка HTML текста. Я практически ничего не знаю о работе с веб-страницами, поэтому мне нужна помощь в том, как мне получить текст из профиля (биография, подписи к сообщениям, комментарии).

Спасибо!

Ответы [ 3 ]

0 голосов
/ 12 июля 2020

Привет, , вы можете разделить код html как строку до и после тега html.

И взять вторую строку в списке для первого разделения и первая строка в списке для второго разбиения.

Но вам нужно знать html, чтобы знать, что такое тег html и как узнать, какой тег вам нужно разделить.

Удачи, надеюсь, я смогу тебе помочь!

0 голосов
/ 12 июля 2020

Вы можете использовать jsoup (https://jsoup.org/) для извлечения указанного тега c из содержимого html.

Вот пример извлечения содержимого тега h1 из тела из HTML.

        // Parse HTML String using JSoup library
        String HTMLSTring = "<!DOCTYPE html>"
                + "<html>"
                + "<head>"
                + "<title>JSoup Example</title>"
                + "</head>"
                + "<body>"
                + "<table><tr><td>
                       <h1>HelloWorld</h1></tr>"
                + "</table>"
                + "</body>"
                + "</html>";
 
        Document html = Jsoup.parse(HTMLSTring);
        String title = html.title();
        String h1 = html.body().getElementsByTag("h1").text();

Вы можете найти еще несколько примеров из следующего сообщения в блоге https://javarevisited.blogspot.com/2014/09/how-to-parse-html-file-in-java-jsoup-example.html

Надеюсь, это будет полезно.

0 голосов
/ 12 июля 2020

Вы можете использовать инструмент для очистки (Scrapy of Parsehub et c). Но будьте осторожны, это противоречит TOS Instagram, так что будьте осторожны подсказка

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...