Соскоб с сайта на основе поиска - PullRequest
0 голосов
/ 24 ноября 2018

Цель

В Java я хочу получить текстовый вывод результата поиска в https://pin1yin1.com/#我是英国人 enter image description here

Что я имеюдо сих пор пробовал

Используя JSoup, я подключился к странице, используя Jsoup.connect("https://pin1yin1.com/#%E6%88%91%E6%98%AF%E8%8B%B1%E5%9B%BD%E4%BA%BA").get();

(цифры и проценты переводятся в китайские иероглифы)

Проблема возникла

Когда я запускаю getAllElements(), чтобы посмотреть, что он очистил, код предназначен только для целевой страницы, то есть того, что пользователь видит до , выполнившего поиск, он не поднимаетчто-нибудь из результатов поиска.

1 Ответ

0 голосов
/ 24 ноября 2018

Я проверил веб-сайт, вы можете получить данные из их остальных API напрямую, попробуйте ниже:

Document doc = Jsoup.connect("https://pin1yin1.com/pinyin/convert/?c=%E6%88%91%E6%98%AF%E8%8B%B1%E5%9B%BD%E4%BA%BA").get();

Ответ ниже:

<html>
<head></head>
<body>
 { "q": "我是英国人", "s": "我是英国人", "t": "我是英國人", "p": 
["wo3","shi4","ying1","guo2","ren2"], "e": ["I; me; my","is; are; am; yes","British person"], "c": [1,1,3] }
 </body></html>
...