парсинг изображения sr c с простым html dom - PullRequest
0 голосов
/ 14 апреля 2020

я пытаюсь получить sr c изображение по этой ссылке: https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel

это то, что я делаю, но не повезло

<?php

 include('simple_html_dom.php');

 $html = file_get_html('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');

 $list = $html->find('div[class="class="auto__base_component auto__shared_react_document_image react_document_image""]',0);

 $list_array = $list->find('img');

 $list_array2['thumb']  = $list_array->find('img.loaded', 0)->src;

 for ( $i = 0; $i < sizeof($list_array2); $i++ ){
  echo $list_array2[$i]->plaintext;
  echo "<br>";
 }

?>

1 Ответ

0 голосов
/ 15 апреля 2020

На самом деле я делаю это, используя php класс DOMDocument, получая все изображения на этой странице, а затем вы можете выбрать то, что вы хотите:

$html = file_get_contents('https://www.scribd.com/book/348571030/The-Alice-Network-A-Novel');
$doc = new DOMDocument();
$doc->loadHTML($html);
$images = $doc->getElementsByTagName('img');
foreach ($images as $image) {
    echo $image->getAttribute('src') . "\n";
}

Я догадываюсь, если вы ищете Обложка IMG, это третье изображение, поэтому получите как показано ниже:

echo $images[2]->getAttribute('src') . "\n";
...