Какой самый простой способ прочитать выделенную таблицу на скриншоте ниже из Excel в Pandas DataFrame? Предположим, у меня есть тысячи таких листов. Область, которую я хочу прочитать, имеет «Col4» в верхнем левом углу и не имеет всю пустую строку или столбец. «Col4» может появиться в любом (строка, столбец) на листе.
Полагаю, я всегда могу пойти с применением метода грубой силы, где я сначала читаю весь лист, нахожу позицию "Col4", а затем извлекаю нужную мне часть. Но мне интересно, есть ли более простой способ сделать это.
Кроме того, до сих пор я работал только с Пандами. Я знаю, что есть много других пакетов, кроме панд, таких как xlwings или xlrd. Если вы знаете, что любой из этих пакетов может быть полезен, пожалуйста, дайте мне знать, и он будет очень признателен.
Обратите внимание, что этот вопрос не является дубликатом pandas read_excel нескольких таблиц на одном листе , поскольку решение в этом посте обрабатывает только случай, когда смещение строки известно заранее.
Бизнес-проблема, стоящая за этим, я решаю, состоит в том, чтобы прочитать много электронных таблиц, созданных неинженерными бригадами (HR, бухгалтерия и т. Д.) В моей компании, и, к сожалению, они не создали электронные таблицы в последовательном и дружественном для программирования путь.