Самый эффективный алгоритм генерации карты сайта? - PullRequest
0 голосов
/ 16 апреля 2009

.. учитывая URL в качестве ввода (язык программирования C). (Спецификации карты сайта от sitemap.org).

1 Ответ

0 голосов
/ 18 апреля 2009

Как указано в комментариях apphacker, мы не знаем, что вы пытаетесь сделать. Если вы планируете просто убирать ссылки с html-сайта, я бы порекомендовал какой-нибудь генератор лексического сканера: например, flex.

Если вы получаете URL-адрес веб-сайта в качестве входных данных, вам потребуется использовать сетевой код для чтения веб-страниц. Если вы ничего не знаете о работе в сети на C, то я бы порекомендовал поискать руководства по гуглу и дальше.

Если вы просто получаете прямой XML-файл, как подсказывают ваши теги, то еще раз я бы порекомендовал flex, если вам абсолютно необходимо использовать C. Если вам не нужно использовать C, то я бы порекомендовал Perl или Python; они, вероятно, лучше подходят для работы.

В любом случае нам нужно, чтобы вы дали нам больше информации, но я надеюсь, что это поможет на данный момент.

...