Обработка списков и структура данных в CSV с Python - PullRequest
0 голосов
/ 25 марта 2020

довольно плохо знаком с Python, но действительно наслаждаюсь обучением и опираюсь на SO для какой-то потрясающей помощи. Тем не менее, я немного застрял и ходить по кругу.

Фон Я подключаюсь к API, а затем извлекаю информацию и записываю ее в CSV. Один из созданных мной CSV-файлов имеет image_id , а также набор ключевых слов .

Код для этого

def process_image(image):
    with open('desktop/'+brand +
             '/'+brand+'_keywords_'+year+month+day+'.csv','a+') as newFile:
        url = api_url
        response = requests.request("GET", url, headers=headers, data=payload)
        json_data = json.loads(response.text)
        keyword = json_data['data']['Iptc']['keyword']
        newFileWriter = csv.writer(newFile)
        newFileWriter.writerow([unicode((image,keyword)).encode('utf8')])
        print image, keyword

Вопрос 1: Имеет ли смысл со структурной точки зрения / нормально ли иметь один столбец в моем CSV? строка, а затем следующий столбец будет список? (некоторые изображения имеют различные ключевые слова, а некоторые - нет)

Пример вывода (в формате CSV) приведенного выше выглядит следующим образом:

"(u'I0000aD1JSU0i6Ec', None)"
"(u'I0000_U54LfGFIDs', u'2017, Aerial Research, Alabama, Birmingham')"
"(u'I0000lb6Z6KqTWY0', u'Men, Mens Apparel, Action, In Use, 2019')"

Моя цель заключается в том, чтобы запустите другой скрипт и проанализируйте ключевые слова, количество изображений без ключевых слов и т. д. c. В идеале, я хотел бы также сохранить image_id в CSV, чтобы я мог легко найти, какие изображения не имеют ключевых слов - но у меня возникают проблемы с выяснением, как работать с кодировкой, и если способ, которым я все настроил, дает смысл.

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...