Очистка данных в AWS EC2 с помощью crontab: в файле журнала отсутствует вывод - PullRequest
0 голосов
/ 28 октября 2019

Я собираю большое количество данных из Интернета, используя crontab на экземпляре AWS EC2. Сценарий очищает тысячи веб-страниц и печатает " webpageID done" после каждого. Поскольку я планирую запустить сценарий, а затем выйти из экземпляра, я сохраняю вывод stdout в файл журнала, используя следующую команду в crontab:

0 19 26 10 * /home/ec2-user/scrape.sh &>> /home/ec2-user/output.log

Сбой сценария после очистки 10 000веб-страниц, но по какой-то причине output.log прекратил печатать « webpageID done» после 8000 веб-страниц. Последние несколько строк в output.log выглядят примерно так:

7998: webpage 012345 done
7999: webpage 012346 done
8000: webpage 012347 d

Таким образом, печать остановилась на полпути, но сценарий продолжал очищать еще 2000 веб-страниц. Почему это может происходить? Есть ли лучший способ сохранить выходные данные при выходе из экземпляра EC2 (т. Е. Без сохранения канала SSH открытым)?

Мой сценарий оболочки начинается с #!/bin/bash.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...