Инструменты для разработки сайтов - PullRequest
2 голосов
/ 03 октября 2008

Многие из заданных здесь вопросов относятся к исследованиям, которые я делаю. Эти вопросы и ответы широко рассредоточены и их не всегда легко найти, просматривая их вручную, а иногда полезный ответ или комментарий встречается и в не связанных темах.

Я хочу автоматизировать поиск соответствующих вопросов и ответов на основе наборов ключевых слов, а затем использовать эту информацию в качестве указателей для дальнейшего углубленного исследования.

Какие инструменты, желательно с открытым исходным кодом, доступны для использования в этом типе майнинга сайтов? Я не веб-гуру, и для их разработки потребуется много времени, а также влияние на время, которое я мог бы потратить на свои исследования и разработки.

Ответы [ 4 ]

1 голос
/ 04 октября 2008

Из вашего вопроса не ясно, являетесь ли вы программистом или нет, поэтому я не уверен, что вам нужны инструменты в смысле приложений или сервисов, которые вам нужны, или библиотека, которая делает майнинг сайтов проще.

Если последний случай и вы используете ruby, я могу полностью порекомендовать WWW :: Mechanize . Он предоставляет хороший API для написания скриптов для поиска веб-страниц (по DOM или по тексту), перехода по ссылкам и заполнения форм. Я использовал это несколько раз, чтобы организовать информацию, которая распространяется на несколько веб-страниц на сайте.

Я полагаю, что версия ruby ​​была основана на более ранней библиотеке для perl , но я не могу поручиться за версию perl, я ее не использовал.

1 голос
/ 03 октября 2008

Другой вариант будет использовать Yahoo! Трубы . ( демо )

Вы можете создать такую ​​систему визуально в режиме онлайн, используя комбинацию URL каналов, фильтров и т. Д. ... Время обучения минимально по сравнению с программированием. [отредактировано: время]

0 голосов
/ 03 октября 2008

Все тэги, основанные на ключевых словах, имеют прикрепленные к ним RSS-каналы, поэтому я бы начал с подписки на соответствующие ключевые слова и поиска данных. Кажется, это самый простой способ найти связанные понятия и другие связанные ключевые слова.

0 голосов
/ 03 октября 2008

В этом случае могут быть полезны инструменты взаимодействия с человеком (без затрат на разработку, возможно, более последовательный результат и меняющиеся требования).

На ум приходит пара:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...