Мне нужно взять список имен и описаний веб-сайта для целей индексации. Как я могу сделать это с помощью PHP? Я думаю, что мне придется использовать DOM правильно?
Да, это лучший способ. Я бы порекомендовал использовать PHP Simple HTML DOM Parser . Вы можете делать изящные вещи, например:
// Create DOM from URL or file $html = file_get_html('http://www.google.com/'); // Find all images foreach($html->find('img') as $element) echo $element->src . '<br>'; // Find all links foreach($html->find('a') as $element) echo $element->href . '<br>';
Что бы вы ни делали, не пытайтесь анализировать HTML с помощью регулярных выражений .