не могу открыть .xlsx в блокноте jupyter - PullRequest
1 голос
/ 29 января 2020

У меня есть «файл Excel 2016» Sb_test.xlsx, который я хочу преобразовать в файл .csv. Однако

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'<## NASC'

произошло в строке wb = xlrd.open_workbook(r"D:/Sb_test.xlsx") следующего кода:

import tensorflow as tf
import pandas as pd
import os, xlrd, csv

def csv_from_excel():
    print (xlrd.__VERSION__, xlrd.__file__) # suggested at google forum
    wb = xlrd.open_workbook(r"D:/Sb_test.xlsx")
    print (xlrd.__VERSION__, xlrd.__file__)
    sh = wb.sheet_by_name('Basic_Classification')
    your_csv_file = open('Sb_01_csv.csv', 'w')
    wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL)

    for rownum in range(sh.nrows):
        wr.writerow(sh.row_values(rownum))

    your_csv_file.close()

csv_from_excel()

В поисках решения я обнаружил, что могу использовать более старую версию xlrd , но нет, это 1.2.0 (самый последний)

и здесь принятый ответ предлагает открыть его с помощью текстового редактора, что в моем случае выглядит так:

enter image description here

Однажды я понял, что

... это определенно не формат Excel .xls

что я должен знать, чтобы преобразовать файл (любого типа) в формат csv?

Все, что я хочу, - это иметь файл типа CSV для дальнейшей работы с машинным обучением ,

Спасибо за помощь.

...