«Правильный» способ сделать это будет через PHP DOM объект, который может импортировать HTML, после чего вы можете использовать XPath для поиска нужной ссылки. Конечно, DOM очень требователен к неверной разметке и может предотвратить довольно простые ошибки, которые хорошо обрабатываются браузерами. Возможно, вам придется помассировать ввод, чтобы исправить наихудшую из ошибок, прежде чем вы сможете выполнить обход контента через DOM.
Наихудшая ошибка, обнаруженная мною в stop-dead-in-DOM, - наличие нескольких блоков html и / или body (например, тупой сервер, вставляющий автономный блок перед фактическим содержимым страницы).