Сканирование данных с внутреннего сайта бронирования номеров - PullRequest
0 голосов
/ 16 октября 2018

В настоящее время у меня есть небольшое задание по сканированию данных из внутренней сети, но я до сих пор не знаю, с чего начать.

У меня есть внутренний веб-сайт о лабораторном бронировании, сначала вам потребуетсявведите имя пользователя и пароль для доступа.

Приходите на страницу бронирования, скажем, после фильтрации, я получаю список информации о бронировании лаборатории А за 7 дней, это означает, что у вас будет 7 таблиц отдельно с колонками 0, 15, 30, 45, представляют для минут, и строки 7:00, 8:00, .... 18:00 представляют для часов.Когда вы нажимаете на каждую ячейку, появляется новое окно с информацией, содержащейся в текстовых полях о лаборатории и ее состоянии (Свободно / Зарезервировано).Если статус «Зарезервирован», он содержит информацию о том, кто бронирует, и до какого времени.Если статус «Свободен», он сопровождается формой для заполнения информации о бронировании, но, думаю, нас это не сильно волнует.Моя цель для этого состоит в том, чтобы после сканирования данных у меня был файл csv, в котором столбцы - это дни, а строки - время, а информация в ячейках - это информация о том, кто бронирует зарезервированные временные интервалы.Он может содержать нулевое значение, если этот временной интервал свободен.

Поскольку это общий внутренний веб-сайт бронирования нашей компании, но при его использовании у нас есть лабораторное правило, поэтому мне нужно проверить, нарушает ли кто-либо из них лабораторное бронирование.Правило или нет, сначала соберите данные автоматически.Я написал сканер с некоторых веб-сайтов на python, но они не пришли с этим форматом, поэтому я немного растерялся.

1 Ответ

0 голосов
/ 16 октября 2018

Если вы пытаетесь автоматизировать этот процесс, я бы предложил Selenium [1]: https://selenium -python.readthedocs.io /

Или, если он просто сканирует, вы можете перейти кпакеты типа Urllib2 или Requests в сочетании с Beautiful Soup.

...