Я пытаюсь очистить гогоаним с веб-сайта с помощью Cheerio js. Пока много работает, пока не наткнулся на стену. Я хочу очистить некоторые данные, которые загружаются позже JavaScript. Я знаю, что Cheerio сохраняет исходный код. И в исходном коде мы видим это:
<div class="main_body">
<div class="anime_name episode_video">
<div class="anime_name_img_episode_video"></div>
<h2>Episodes</h2>
</div>
<div class="clr"></div>
<div class="anime_video_body" id="episode_wrapper">Loading...</div>
</div>
Данные, которые я хочу очистить, загружаются позже внутри #episode_wrapper. Это будет загружено в:
<ul data-range="0" style="display:block">
<li>
<a data-name="1:01" data-name-normalized="1" href="/anime/my-hero-academia-dub-jwwn/ep-1" class="active" data-servers="28,40,35">
EP 01
</a>
</li>
<li>
<a data-name="2:02" data-name-normalized="2" href="/anime/my-hero-academia-dub-jwwn/ep-2" data-servers="28,40,35">
EP 02
</a>
</li>
...
</ul>
Итак, я знаю, что я должен дождаться загрузки данных, прежде чем очищать страницу. Но я думаю, этого нельзя сделать с Cheerio. Но я видел этот репозиторий, где разработчик также использует Cheerio:
См. Функцию: animeContentHandler. https://github.com/ChrisMichaelPerezSantiago/gogoanime/blob/master/src/api/api.js
Честно говоря, я не понимаю, почему он может очистить его с помощью Cheerio. Когда я пытаюсь очистить элементы, я не могу найти данные, содержащие все эпизоды.
Как лучше всего двигаться дальше? Как лучше всего очистить данные, которые загружаются позже? И может кто-нибудь объяснить мне, почему это работает для него, а не для меня.
Я ценю всю помощь!