Цикл Python не прерывается как следует после использования счетчика - PullRequest
0 голосов
/ 02 марта 2019

Я добавил счетчик в конце кода ниже.Тем не менее, когда код продолжает работать после счетчика 10, где я установил его, чтобы сломатьНе могу понять, что я делаю не так.

chromedriver='C:\\Users\\user\\Downloads\\chromedriver_win32\\chromedriver.exe'

options=webdriver.ChromeOptions()
options.add_argument('headless')
options.add_argument('window-size=1200x600')
browser=webdriver.Chrome(executable_path=chromedriver,chrome_options=options)

path='C:/Users/something.xlsx'

xls=pd.read_excel(path)
data=xls["companyname"].tolist()
data=[w.replace('" "','+') for w in data]

book=openpyxl.load_workbook(path)
sheet=book.active
try:
    delete=book['Python Data']
    book.remove(delete)
except Exception:
    pass
book.create_sheet('Python Data')
ws1=book['Python Data']
book.save(path)

counter=0

while data:
    for item in data:
        browser.get('https://duckduckgo.com/?q='+item+'&t=h_')
        results = browser.find_elements_by_id('links')
        num_page_items = len(results)
        for i in range(num_page_items):
            mylist = results[i].text
            row=len(ws1['A']) + 1
            ws1.cell(row=1,column=1,value="Results")
            ws1.cell(row=row,column=1,value=mylist)
            book.save(path)
            counter += 1
            print(counter)
            if counter==10:
                break

Ответы [ 2 ]

0 голосов
/ 02 марта 2019

Как написано в 4.4.операторы break и continue и другие операторы Loops :

Оператор break, как и в C, выходит за пределы внутренней оболочки for или while loop.

В вашем коде это:

for i in range(num_page_items):
     .....
0 голосов
/ 02 марта 2019

Ваш код после достижения counter == 10 выполняется снова из-за бесконечного оператора while data.Пожалуйста, обратите внимание, что break здесь не экранирует while утверждение, это действительно для for i in range(num_page_items).

Пожалуйста, используйте следующий код:

# notice lack of while data statement
for item in data:
    browser.get('https://duckduckgo.com/?q='+item+'&t=h_')
    results = browser.find_elements_by_id('links')
    num_page_items = len(results)
    for i in range(num_page_items):
        mylist = results[i].text
        row=len(ws1['A']) + 1
        ws1.cell(row=1,column=1,value="Results")
        ws1.cell(row=row,column=1,value=mylist)
        book.save(path)
        counter += 1
        print(counter)
        if counter==10:
            break
...