Как я могу написать python сценарии, используя pandas для перебора файлов Excel .xlsx с несколькими листами? - PullRequest
0 голосов
/ 09 апреля 2020

У меня есть несколько файлов Excel .Xlsx. Каждый файл содержит несколько листов. Я использовал следующий код для чтения и извлечения данных из файлов:

import pandas as pd
file = pd.ExcelFile('my_file.xlsx')
file.sheet_names #Displays the sheet names
df = file.parse('Sheet1') #To parse Sheet1
df.columns #To list columns

Меня интересуют столбцы электронной почты на каждом листе. Я делал это почти вручную с кодом выше. Мне нужен код, чтобы автоматически перебирать листы и извлекать все электронные письма. Помощь!

1 Ответ

3 голосов
/ 09 апреля 2020

Вы можете передать все файлы и все листы с помощью для l oop:

import pandas as pd
import os

emails = []
files_dir = "/your_path_to_the_xlsx_files"
for file in os.listdir(files_dir):
    excel = pd.ExcelFile(os.path.join(files_dir,file))
    for sheet in excel.sheet_names:
        df = excel.parse(sheet)
        if 'email' not in df.columns:
            continue
        emails.extend(df['email'].tolist())

Теперь у вас есть все электронные письма в списке электронных писем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...