Как указано в комментариях apphacker, мы не знаем, что вы пытаетесь сделать. Если вы планируете просто убирать ссылки с html-сайта, я бы порекомендовал какой-нибудь генератор лексического сканера: например, flex.
Если вы получаете URL-адрес веб-сайта в качестве входных данных, вам потребуется использовать сетевой код для чтения веб-страниц. Если вы ничего не знаете о работе в сети на C, то я бы порекомендовал поискать руководства по гуглу и дальше.
Если вы просто получаете прямой XML-файл, как подсказывают ваши теги, то еще раз я бы порекомендовал flex, если вам абсолютно необходимо использовать C. Если вам не нужно использовать C, то я бы порекомендовал Perl или Python; они, вероятно, лучше подходят для работы.
В любом случае нам нужно, чтобы вы дали нам больше информации, но я надеюсь, что это поможет на данный момент.