Запуск многопоточного кода после Queue.task_done () - PullRequest
0 голосов
/ 09 апреля 2019

В классическом приложении Threading / Queue.Мне нужно сделать дальнейшие вычисления в моей «потребительской» функции.После того как очередь пуста, дальнейший код не выполняется после urls.task_done ().

Я импортирую рыночные данные из API-интерфейса JSON и импортирую их в базу данных MariaDB.В API каждый элемент, который я хочу получить, имеет собственный URL, поэтому я создаю очередь для всех доступных URL в функции.Функция-потребитель обрабатывает очередь, импортируя новый набор данных или обновляя существующую запись, в зависимости от уже существующих данных в моей базе данных.Я уже пытался обернуть реальный цикл while в свою собственную функцию, но у меня это не сработало.

def create_url():
    try:
        mariadb_connection = mariadb.connect(host='host
                                             database='db',
                                             user='user',                                             
                                           password='pw')

        cursor = mariadb_connection.cursor()

        cursor.execute('SELECT type_id from tbl_items')
        item_list = cursor.fetchall()
        print("Create URL - Record retrieved successfully")

        for row in item_list:

            url = 'https://someinternet.com/type_id=' + \
                str(row[0])
            urls.put(url)

        return urls

    except mariadb.Error as error:
        mariadb_connection.rollback()  
        print("Failed retrieving itemtypes from tbl_items table 
        {}".format(error))

    finally:
        if mariadb_connection.is_connected():
            cursor.close()
            mariadb_connection.close()

def import(urls):
    list_mo_esi = []
    try:
        mariadb_connection = mariadb.connect(host='host',
                                             database='db',
                                             user='user',
                                             password='pw')

        cursor = mariadb_connection.cursor()

        while True:
            s = requests.Session()
            retries = Retry(total=5, backoff_factor=1, status_forcelist=[502, 503, 504])
            s.mount('https://', HTTPAdapter(max_retries=retries))
            jsonraw = s.get(urls.get())
            jsondata = ujson.loads(jsonraw.text)

            for row in jsondata:
                cursor.execute('SELECT order_id from tbl_mo WHERE order_id = %s',
                               (row['order_id'], ))
                exists_mo = cursor.fetchall()
                list_mo_esi.append(row['order_id'])

                if len(exists_mo) != 0:
                    print("updating order#", row['order_id'])
                    cursor.execute('UPDATE tbl_mo SET volume = %s, price = %s WHERE order_id = %s',
                                   (row['volume_remain'], row['price'], row['order_id'], ))
                    mariadb_connection.commit()
                else:
                        cursor.execute('INSERT INTO tbl_mo (type_id, order_id, ordertype,volume, price) VALUES (%s,%s,%s,%s,%s)',
                                       (row['type_id'], row['order_id'], row['is_buy_order'], row['volume_remain'], row['price'], ))
                        mariadb_connection.commit()

            urls.task_done()

    except mariadb.Error as error:
        mariadb_connection.rollback()  
        print("Failed retrieving itemtypes from tbl_items table {}".format(error))

Следующая, наконец, часть моей функции не выполняется, но должна.

    finally:
        list_mo_purge = list(set(list_mo_sql)-set(list_mo_esi))
        cursor.execute('SELECT order_id FROM tbl_mo')
        list_mo_sql = cursor.fetchall()
        print(len(list_mo_esi))
        print(len(list_mo_sql))

        if mariadb_connection.is_connected():
            cursor.close()
            mariadb_connection.close()

основной поток

for i in range(num_threads):
    worker = Thread(target=import_mo, args=(urls,))
    worker.setDaemon(True)
    worker.start()

create_url()

urls.join()

После того, как все задачи будут выполнены, мой рабочий перестанет выполнять код сразу после urls.task_done ().Тем не менее, у меня есть еще немного кода после функции urls.task_done (), которую мне нужно выполнить для закрытия соединения с базой данных и очистки моей базы данных от старых записей.Как я могу запустить этот "наконец-то"?

1 Ответ

0 голосов
/ 09 апреля 2019

Вы не ломаетесь от времени.

Вы должны сделать следующее:

if urls.empty():
    break

Скорее всего, ваш import поток заблокирован на urls.get()

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...