Есть так много способов. Де-факто вы хотите разобрать HTML-файл. strip_tags - один из способов, но грязный.
Я рекомендую вам использовать для этого класс DOMDocument (здесь, на so.com, должно быть много других способов). Остальное - стандартный php, запись и чтение из CSV хорошо документированы на php.net
Пример получения ссылок на сайте (не мной):
http://php.net/manual/en/class.domdocument.php#95894