CSV не анализируется должным образом.Дает 'Кавычки без кавычек не позволяют \ r или \ n' - PullRequest
0 голосов
/ 23 ноября 2018

Я использую селен и питон, чтобы сделать соскоб.Python2.7 OS - Mac 10.14 Mojave

Ошибка: поля без кавычек не допускают \ r или \ n (строка 2).

Это означает проблему с разрывом строки.Я сделал это:

des = driver.find_element_by_xpath('//*[@id="descriptiontext"]/div/div/div')
            .get_attribute('innerHTML')
            .encode('ascii', 'ignore')
            .decode('ascii')
regex=re.compile('<a.*?a>') #taking out <a> tags
des1 = str(re.findall(regex, des)[0])
des = des.replace(des1,'')

with open("new.csv", "a") as myfile:
  myfilewriter = csv.writer(myfile)

  if len(menuList)==2:
    print (des)
    type,tags=blank,blank
    published='TRUE'
    option1 = menuList.items()[0][0]
    option1Val=  menuList.items()[0][1][0].items()[0][0]
    option2 = menuList.items()[1][0]
    option2Val=menuList.items()[1][1][0].items()[0][0]
    option3, option3Val= blank,blank
    sku = directory
    gram = '0'
    v_inventory='shopify'
    v_inventory_quantity= '100'
    v_inventory_policy= 'continue'
    v_fulfillment_service='manual'
    try:
        v_price = float(menuList.items()[1][1][0].items()[0][1]) + 10.99
    except:
        v_price = 10.99 + price
    v_compare_price = blank
    v_shipping= 'TRUE'
    v_taxable= 'FALSE'
    v_barcode = blank
    v_imgsrc = blank
    img_pos = blank
    img_alt = blank
    giftCard= 'FALSE'
    seo_title,seo_des,gShopping,gSG,gSA,gMPN,gAd,gAdL,gSC,gCP,gSCL,gSCL1,gSCL2,gSCL3,gSCL4,v_image= blank,blank,blank,blank,blank,blank,blank,blank,blank,blank,blank,blank,blank,blank,blank,blank
    v_weight_unit ='lb'
    v_tax, cpi=blank,blank
    myfilewriter.writerow([handle,title,des,vendor,type,tags,published,option1,option1Val,option2,option2Val,option3,option3Val,sku,gram,v_inventory,v_inventory_quantity,
                           v_inventory_policy,v_fulfillment_service,v_price,v_compare_price,v_shipping,v_taxable,
                           v_barcode,v_imgsrc,img_pos,img_alt,giftCard,seo_title,seo_des,gShopping,gSG,gSA,gMPN,gAd,gAdL,gSC,gCP,gSCL,gSCL1,gSCL2,gSCL3,gSCL4,v_image,
                           v_weight_unit,v_tax,cpi])

Не уверен, что еще я могу сделать.Вывод 'des' - это html описания продукта.Таким образом, показ csv версии «des» отображает сам HTML.

Пожалуйста, оставьте свой адрес электронной почты, я был бы рад выслать файл csv и код утилизации.

1 Ответ

0 голосов
/ 24 ноября 2018

Обновление :: Боже мой!Буквально потрачено 2 дня на это.Проблема была из-за Mac.Когда используются Windows Comma Separated Values ​​(.csv), это работает! .... Безумный ... кто-нибудь может меня просветить, в чем разница?

...