Если вы можете просмотреть HTML-код веб-сайта, с которого вы пытаетесь извлечь информацию, и у них есть система логического именования для сущностей новостных статей, вы сможете использовать команду fopen, например.
<?php
$handle = fopen("http://www.example.com/", "r");
?>
И затем с информацией, которую он извлекает из кода статьи, если код статьи был изложен следующим образом:
<div class="post" id="post-16283">
<div class="postheader">
<h1 id="article-title">Test Article Code</h1>
</div>
<div class="postcontent">
This is the article text
</div>
<div class="postfooter">
Copyright Information
</div>
</div>
Затем вы можете использовать следующий php-код, чтобы показать все названия статей:
if (preg_match_all("#<div class="postheader"(.*?)</div>#s", $handle, $matches, PREG_PATTERN_ORDER) > 0) {
foreach ($matches[0] as $match) {
echo $match;
}
}
Это просто основной индикатор того, как извлечь информацию с веб-страницы. Его можно разработать, чтобы вы могли извлечь информационную статью за статьей с веб-страницы, а затем даже отформатировать ее по-своему.
Надеюсь, это поможет