У меня есть «файл Excel 2016» Sb_test.xlsx
, который я хочу преобразовать в файл .csv
. Однако
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'<## NASC'
произошло в строке wb = xlrd.open_workbook(r"D:/Sb_test.xlsx")
следующего кода:
import tensorflow as tf
import pandas as pd
import os, xlrd, csv
def csv_from_excel():
print (xlrd.__VERSION__, xlrd.__file__) # suggested at google forum
wb = xlrd.open_workbook(r"D:/Sb_test.xlsx")
print (xlrd.__VERSION__, xlrd.__file__)
sh = wb.sheet_by_name('Basic_Classification')
your_csv_file = open('Sb_01_csv.csv', 'w')
wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL)
for rownum in range(sh.nrows):
wr.writerow(sh.row_values(rownum))
your_csv_file.close()
csv_from_excel()
В поисках решения я обнаружил, что могу использовать более старую версию xlrd
, но нет, это 1.2.0 (самый последний)
и здесь принятый ответ предлагает открыть его с помощью текстового редактора, что в моем случае выглядит так:
Однажды я понял, что
... это определенно не формат Excel .xls
что я должен знать, чтобы преобразовать файл (любого типа) в формат csv?
Все, что я хочу, - это иметь файл типа CSV для дальнейшей работы с машинным обучением ,
Спасибо за помощь.