Поиск направлений для создания онлайн базы данных веб-скребка - PullRequest
0 голосов
/ 11 января 2019

Я хотел бы начать писать на python для создания онлайн-базы данных. В частности, я хотел бы запустить сайт, который собирает данные с других сайтов (которые, очевидно, предлагают поделиться своим контентом) для централизации информации.

Я занимался программированием раньше и у меня есть элементарное понимание языков программирования, поэтому я прекрасно понимаю, как узнать о переменных, классах и тому подобном. Что меня смущает, так это концептуализация всего этого и то, как его реализовать. Может быть, я смогу обрисовать то, о чем я думал в отдельности, и вы, ребята, можете сказать, имеет ли это смысл или нет:

Я подумал о размещении веб-сайта, который запускает что-то вроде django и может, таким образом, выполнить скрипт python или приложение, которое собирает информацию с других сайтов, вырезает важную информацию, а затем отображает ее аккуратно и по порядку. Это также должно включать базу данных с возможностью поиска. Это то, для чего мне нужен SQL? Или любой другой язык программирования баз данных? Я никогда не работал с базами данных раньше. Я также хотел бы предоставить вариант предложений, чтобы при вводе одного термина предлагались предложения.

Итак, код сайта с HTML, CSS и JS, затем фреймворк django, работающий на python, а затем ... SQL? Надеюсь, это имеет смысл, по крайней мере, я сейчас об этом думаю.

Я был бы рад услышать от вас, ребята, правильно ли я здесь думаю. Кроме того, я был бы очень рад, если бы вы указали мне на подходящие ресурсы. Я сам немного искал, наткнулся на Automate The Boring Stuff и тому подобное, но до сих пор это не соответствовало тому, что я пытаюсь сделать. В любом случае, спасибо заранее за любые ответы! :)

1 Ответ

0 голосов
/ 12 января 2019

Вы можете подписаться на PythonWeekly. У них есть статьи о перескакивании с питоном время от времени.

См. Например: https://rrighart.github.io/Webscraping/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...