Какой веб-язык можно использовать для интеллектуального анализа данных или веб-сканирования - PullRequest
1 голос
/ 12 сентября 2010

, если я хочу создать сложный веб-сайт, такой как новости Google, который собирает данные с других сайтов.как добыча данных, сканирование.На каком языке я должен строить сайт.

В настоящее время я знаю только PHP.Могу ли я сделать это в PHP

Ответы [ 2 ]

2 голосов
/ 12 сентября 2010

Python - отличный язык для обеих этих задач. Я не могу легко назвать все доступные пакеты, но первое, что приходит на ум при сканировании через Интернет, это Механизация и BeautifulSoup . Orange и NLTK реализуют несколько алгоритмов извлечения данных.

0 голосов
/ 12 сентября 2010

Похоже, вам нужно создать два приложения: что-то для сканирования в Интернете и сохранения данных в базе данных, а затем веб-сайт для отображения собранных данных.Я бы использовал Perl для сканирования Интернета, потому что это хорошая функция для работы со строками.

...