Я хочу проанализировать файл robots.txt
и извлечь ссылку на карту сайта.Предполагая, что файл выглядит примерно так:
stuff
foobar
Sitemap: http://www.cgdomestics.co.uk/sitemap.xml
hello world
more stuff
Я пытаюсь использовать регулярные выражения для извлечения именно этого;
http://www.cgdomestics.co.uk/sitemap.xml
Пока у меня есть этот код PHP;
<?php
$robots_url = "http://www.cgdomestics.co.uk/robots.txt";
$robots_file = file_get_contents($robots_url);
$pattern = "/Sitemap: .*/";
$i = preg_match($pattern, $robots_file, $match);
echo $match[0];
?>
Вывод вышеприведенного:; 1011 *
Sitemap: http://www.cgdomestics.co.uk/sitemap.xml
, но я хочу, чтобы он выводил только;
http://www.cgdomestics.co.uk/sitemap.xml
Могу ли я использовать регулярное выражение для возврата именно того, что хочумне нужно сделать еще один шаг, чтобы удалить часть "Sitemap:"?Или есть лучший способ сделать это?
Как вы, вероятно, можете сказать, что я нечастый пользователь PHP и регулярных выражений.
Спасибо.
Найджел