, если я хочу создать сложный веб-сайт, такой как новости Google, который собирает данные с других сайтов.как добыча данных, сканирование.На каком языке я должен строить сайт.
В настоящее время я знаю только PHP.Могу ли я сделать это в PHP
Python - отличный язык для обеих этих задач. Я не могу легко назвать все доступные пакеты, но первое, что приходит на ум при сканировании через Интернет, это Механизация и BeautifulSoup . Orange и NLTK реализуют несколько алгоритмов извлечения данных.
Похоже, вам нужно создать два приложения: что-то для сканирования в Интернете и сохранения данных в базе данных, а затем веб-сайт для отображения собранных данных.Я бы использовал Perl для сканирования Интернета, потому что это хорошая функция для работы со строками.