У меня есть 3 сценария Python
- grab.py: Принимает в качестве ввода имя учетной записи Instagram и выводит текстовый файл, содержащий всех его подписчиков.
- scrape.py: Принимает в качестве входных данных выходные данные из grab.py и выводит подробную информацию о каждой учетной записи (число подписчиков, количество постов и т. Д.) В форме csv
- analy.py: Базовая модель машинного обучения, использующая результаты scrape.py для анализа учетных записей.
3 сценария работают, как и ожидалось, по отдельности.Следующим шагом является создание конечной точки API, которая примет имя учетной записи в качестве параметра запроса, а затем запустит 3 вышеуказанных сценария для полученной учетной записи.Результаты окончательного анализа будут сохранены в базе данных.
Конечной точке также необходимо иметь механизм организации очередей для хранения полученных имен учетных записей.Очередь будет опрошена, и если имена учетных записей доступны, они будут обработаны последовательно.
Мой опыт разработки API ограничен, поэтому я не уверен в наилучшем подходе к решению этой проблемы.Мои вопросы:
- Должна ли моя конечная точка API быть написана на Python?Если да, является ли жизнеспособным фреймворк Flask?Если нет, какие еще у меня есть варианты?
- Существует ли какой-то конвейер, который я могу использовать для бесшовной интеграции трех сценариев?
- Есть ли идея поддерживать очередь впамять и опрос его с помощью отдельного потока, выполняющего бесконечный цикл while, хорошая идея?Есть ли лучший способ сделать это?