Python 2.7: чтение Excel с таблицей внутри ячейки - PullRequest
0 голосов
/ 16 мая 2019

У меня есть странное превосходство , в котором есть таблица Microsoft-word внутри ячейки. Я пробовал openpyxl прочитать эту ячейку:

wb = openpyxl.load_workbook('weirdexcel.xlsx')
sheet = wb.active
print sheet.cell(row = 1, column = 2).value 

но это не работает. Может кто-нибудь предложить мне, как прочитать каждый элемент этой таблицы, который находится внутри этой ячейки Excel? Или предложить какой модуль Python может быть полезен здесь?

Обновление: Я сжал и распаковал файл excel и нахожу таблицу в папке embeddings в виде файла MS-Word, используя следующий код:

myExcelFile = zipfile.ZipFile("weirdexcel.xlsx") 
myExcelFile.extractall("myFolder")
myExcelFile.close()

Теперь мой вопрос: как узнать, что этот файл MS-слова принадлежит строке, имеющей идентификатор L_SpVer_1133 ? Мне нужно найти связь между файлами MS-word и их строками (к какой строке они принадлежат в файле Excel) на случай, если в weirdexcel.xlsx много строк со встроенными таблицами. .

1 Ответ

1 голос
/ 16 мая 2019

Файл Word находится не внутри B2, а в самом листе. В настоящее время openpyxl не видит файл и, следовательно, вы не можете получить к нему доступ.

Вероятно, вы можете получить исходный файл, разархивировав XLSX и выполнив поиск по содержимому для встроенного документа.

...