Question

Код помог мне загрузить кучу картинок из гугла. Раньше он работал несколько дней назад, и теперь внезапно код ломается.

Код:

# importing google_images_download module 
from google_images_download import google_images_download  

# creating object 
response = google_images_download.googleimagesdownload()  

search_queries = ['Apple', 'Orange', 'Grapes', 'water melon'] 


def downloadimages(query): 
    # keywords is the search query 
    # format is the image file format 
    # limit is the number of images to be downloaded 
    # print urs is to print the image file url 
    # size is the image size which can 
    # be specified manually ("large, medium, icon") 
    # aspect ratio denotes the height width ratio 
    # of images to download. ("tall, square, wide, panoramic") 
    arguments = {"keywords": query, 
                 "format": "jpg", 
                 "limit":4, 
                 "print_urls":True, 
                 "size": "medium", 
                 "aspect_ratio": "panoramic"} 
    try: 
        response.download(arguments) 

    # Handling File NotFound Error     
    except FileNotFoundError:  
        arguments = {"keywords": query, 
                     "format": "jpg", 
                     "limit":4, 
                     "print_urls":True,  
                     "size": "medium"} 

        # Providing arguments for the searched query 
        try: 
            # Downloading the photos based 
            # on the given arguments 
            response.download(arguments)  
        except: 
            pass

# Driver Code 
for query in search_queries: 
    downloadimages(query)  
    print()

Выходной журнал:

Номер позиции: 1 -> Название элемента = Оценка Apple .. Начало загрузки ...

К сожалению, все 4 не могут быть загружены, так как некоторые изображения были недоступны для загрузки. 0 - это все, что у нас есть для этого поискового фильтра!

Ошибки: 0

№ объекта: 1 -> Название элемента = Orange Evaluating ... Starting Download ...

К сожалению, все 4 не могут быть загружены, потому что некоторые изображения не могут быть загружены. 0 - это все, что мы получили для этого поискового фильтра!

Ошибки: 0

№ объекта: 1 -> Название элемента = Оценка винограда ... Начало загрузки ...

К сожалению, все 4 не могут быть загружены, потому что некоторые изображения не могут быть загружены. 0 - это все, что мы получили для этого поискового фильтра!

Ошибки: 0

№ объекта: 1 -> Название элемента = арбуз Оценка ... Начало загрузки ...

К сожалению, все 4 не могут быть загружены, потому что некоторые изображения не могут быть загружены. 0 - это все, что мы получили для этого поискового фильтра!

Ошибки: 0

Это фактически создает папку, но в ней нет изображений.

Eamonn Kenny · Answer 1 · 14 апреля 2020

Причина, по которой это не работает, заключается в том, что Google изменил способ, которым они все делают, так что теперь вам нужно включить ключ api_key в строку поиска. В результате такие пакеты, как google-images-download, больше не работают, даже если вы используете версию 2.8.0, поскольку у них нет заполнителя для вставки строки api_key, которую вы должны зарегистрировать в Google, чтобы получать 2500 бесплатных загрузок в день.

Так что лучший способ сделать это сейчас - использовать пакет pip google-search-results и предоставить свой api_key как часть параметров запроса.

params = {
           "engine" : "google",
           ...
           "api_key" : "secret_api_key" 
}

, где вы предоставляете свой API введите себя, а затем позвоните:

client = GoogleSearchResults(params)
results = client.get_dict()

Возвращает строку JSON со ссылкой на все URL-адреса изображений, а затем вы просто скачиваете их напрямую.

nguyentran · Answer 2 · 20 февраля 2020

Я думаю, что Google меняет DOM. Элемент class = "rg_meta notranslate" больше не существует. Это изменено на class = "rg_i ..."


def get_soup(url,header):
    return BeautifulSoup(urllib2.urlopen(urllib2.Request(url,headers=header)),'html.parser')    

def main(args):
    query = "typical face"
    query = query.split()
    query = '+'.join(query)
    url = "https://www.google.co.in/search?q="+query+"&source=lnms&tbm=isch"
    headers = {}
    headers['User-Agent'] = "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"
    soup = get_soup(url, headers)
    for a in soup.find_all("img", {"class": "rg_i"}):
        wget.download(a.attrs["data-iurl"], a.attrs["data-iid"])


if __name__ == '__main__':
    from sys import argv
    try:
        main(argv)
    except KeyboardInterrupt:
        pass
    sys.exit()

FUNNYDMAN · Answer 3 · 01 марта 2020

Действительно, проблема появилась не так давно go, уже есть куча похожих проблем Github:

К сожалению, официального решения пока нет, на данный момент вы можете использовать временное решение, которое было предоставлено в обсуждениях.

Ali Cirik · Answer 4 · 10 февраля 2020

Похоже, что есть проблема с пакетом. Смотрите эти открытые PR: PR1 и PR2

почему я не могу загрузить изображения из Google с python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

почему я не могу загрузить изображения из Google с python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы