Требуется отзыв о скрипте Python RSYNC - PullRequest
1 голос
/ 21 апреля 2011

Этот скрипт отлично работает, но я уверен, что некоторые из вас, гуру, могут его оптимизировать!

Назначение сценария:

  • "смотреть" каталог для новых файлов с определенным расширением
  • убедитесь, что файл еще не копируется
  • rsync файл на удаленный сервер
  • rsync удаляет файл
  • Скрипт непрерывно зацикливается навсегда
  • переживает перебои с Интернетом / сетью
  • не оставляет частичного файла на удаленном сервере

    import os
    import subprocess
    import time
    import logging
    import datetime
    from sys import argv
    
    if len(argv) < 3:
        exit('Please provide two arguments - Source Destination')
    
    
    LOC_DIR = argv[1]
    REM_DIR = argv[2]
    
    POLL_INT = 10
    RUN_INT = 60
    FILE_EXT = '.mov'
    
    
    # logging setup
    logging.basicConfig(filename='%s' % os.path.join(LOC_DIR, '%s script.log' % datetime.datetime.now()),level=logging.DEBUG)
    
    # make an easy print and logging function
    def printLog(string):
        print '%s %s' % (datetime.datetime.now(), string)
        logging.info('%s %s' % (datetime.datetime.now(), string))
    
    
    # get the files with absolute paths
    def getFiles(path):
        return [os.path.join(path, entry) for entry in os.listdir(path)]
    
    
    # check if file is still being copied (file size has changed within the poll interval)
    def checkSize(path):
        same = False
        while same is False:
            printLog("Processing '%s'" % os.path.basename(path))
            printLog('Waiting %s seconds for any filesize change' % POLL_INT)
            size1 = os.path.getsize(path)
            time.sleep(POLL_INT)
            size2 = os.path.getsize(path)
            if size1 == size2:
                same = True
                printLog('File size stayed the same for %s seconds' % POLL_INT)
                return same
            else:
                printLog('File size change detected. Waiting a further %s seconds' % POLL_INT)
    
    
    # check if correct file extension
    def checkExt(path):
        if path.endswith(FILE_EXT):
            return True
    
    
    # rsync subprocess
    def rsyncFile(path):
        printLog("Syncing file '%s'" % os.path.basename(path))
        try:
            command = ['rsync', '-a', '--remove-source-files', path, REM_DIR]
            p = subprocess.Popen(command, stdout=subprocess.PIPE)
            for line in p.stdout:
                printLog("rsync: '%s'" %line)
            p.wait()
            if p.returncode == 0:
                printLog('<<< File synced successfully :) >>>')
            elif p.returncode == 10:
                printLog('****** Please check your internet connection!! ******  Rsync error code: %s' % p.returncode)
            else:
                printLog('There was a problem. Error code: %s' % p.returncode)
        except Exception as e:
            logging.debug(e)
    
    
    # main logic
    def main():
        all_files = getFiles(LOC_DIR)
        files = []
        for f in all_files:
            if checkExt(f):
                files.append(f)
        if len(files) == 1:
            printLog('<<< Found %s matching file >>>' % len(files))
        elif len(files) > 1:
            printLog('<<< Found %s matching files >>>' % len(files))
        for f in files:
            if checkSize(f):
                rsyncFile(f)
        printLog('No files found.  Checking again in %s seconds' % RUN_INT)
        time.sleep(RUN_INT)
        printLog('Checking for files')
        main()
    
    if __name__ == "__main__":
    
    
        main()
    

1 Ответ

2 голосов
/ 21 апреля 2011

сначала исключите бесполезное утверждение

# check if correct file extension
def checkExt(path):
    return path.endswith(FILE_EXT)

, затем будьте чуть более питоническим

# rsync subprocess
def rsyncFile(path):
    printLog("Syncing file '%s'" % os.path.basename(path))
    try:
        p = subprocess.Popen(['rsync', '-a', '--remove-source-files', path, REM_DIR], stdout=subprocess.PIPE)
        for line in p.stdout:
            printLog("rsync: '%s'" %line)
        p.wait()
        printlog(
            { 
                0  : '<<< File synced successfully :) >>>',
                10 : '****** Please check your internet connection!! ******  Rsync error code: %s' % p.returncode,
            }.get(p.returncode, '****** Please check your internet connection!! ******  Rsync error code: %s' % p.returncode) # A switch statement in python !
        )
    except:
        logging.exception("An exception occured")

При использовании «logging.exception» вы увидите исключение и трассировку, вызвавшую проблему.

затем уменьшите main

def main():
    while True:
        files = [f for f in getFiles(LOC_DIR) if checkExt(f)]
        if len(files) == 1:
            printLog('<<< Found %s matching file >>>' % len(files))
        elif len(files) > 1:
            printLog('<<< Found %s matching files >>>' % len(files))
        for f in files:
            if checkSize(f):
                rsyncFile(f)
        printLog('No files found.  Checking again in %s seconds' % RUN_INT)
        time.sleep(RUN_INT)
        printLog('Checking for files')

оператор "while True:" позволит избежать предела рекурсии, которого вы могли бы легко достичь при вызове main () в конце основного кода

комментарии и замечания приветствуются:)

...