довольно плохо знаком с Python, но действительно наслаждаюсь обучением и опираюсь на SO для какой-то потрясающей помощи. Тем не менее, я немного застрял и ходить по кругу.
Фон Я подключаюсь к API, а затем извлекаю информацию и записываю ее в CSV. Один из созданных мной CSV-файлов имеет image_id , а также набор ключевых слов .
Код для этого
def process_image(image):
with open('desktop/'+brand +
'/'+brand+'_keywords_'+year+month+day+'.csv','a+') as newFile:
url = api_url
response = requests.request("GET", url, headers=headers, data=payload)
json_data = json.loads(response.text)
keyword = json_data['data']['Iptc']['keyword']
newFileWriter = csv.writer(newFile)
newFileWriter.writerow([unicode((image,keyword)).encode('utf8')])
print image, keyword
Вопрос 1: Имеет ли смысл со структурной точки зрения / нормально ли иметь один столбец в моем CSV? строка, а затем следующий столбец будет список? (некоторые изображения имеют различные ключевые слова, а некоторые - нет)
Пример вывода (в формате CSV) приведенного выше выглядит следующим образом:
"(u'I0000aD1JSU0i6Ec', None)"
"(u'I0000_U54LfGFIDs', u'2017, Aerial Research, Alabama, Birmingham')"
"(u'I0000lb6Z6KqTWY0', u'Men, Mens Apparel, Action, In Use, 2019')"
Моя цель заключается в том, чтобы запустите другой скрипт и проанализируйте ключевые слова, количество изображений без ключевых слов и т. д. c. В идеале, я хотел бы также сохранить image_id в CSV, чтобы я мог легко найти, какие изображения не имеют ключевых слов - но у меня возникают проблемы с выяснением, как работать с кодировкой, и если способ, которым я все настроил, дает смысл.
Спасибо!