Автоматизация разделения листов Excel на основе значений столбцов с Python - PullRequest
1 голос
/ 10 марта 2020

Учтите, у меня огромный лист Excel с несколькими столбцами и записями. Однако существует определенный столбец (COLUMN A), содержащий логические значения 0 и 1. Теперь я sh разделю свой родительский лист Excel на 2 листа, основываясь на значениях КОЛОННЫ А. Я уже знаю, что это можно сделать с помощью кодов VBA. Тем не менее, я хочу попробовать это на python. Моя идея заключается в том, что мы можем выполнить итерацию по указанным значениям столбца, и, если условие выполнено, взять всю строку и записать ее на новом листе. Я изучаю язык, могу использовать numpy и pandas немного для создания моделей линейной регрессии и тому подобное. Я бы хотел поработать над этим «личным проектом». Буду рад, если кто-нибудь поможет мне с этим, предоставит несколько советов или что-то для начала. Спасибо.

1 Ответ

1 голос
/ 10 марта 2020

Как бы я go об этом:

  1. Читайте полный лист Excel в pandas фрейме данных df = pd.from_excel("file_name.xlsx")

  2. Фильтрация кадра данных по значениям в этих столбцах

df1 = df[df["COLUMN A"]==1]
df0 = df[df["COLUMN A"]==0]
Считайте эти новые кадры данных в новую книгу Excel или новый лист Excel в существующей книге, используя pandas ExcelWriter: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.ExcelWriter.html

Не не забудьте обработать пропущенные данные в столбце A, если они есть.

Я просто студент, поэтому, возможно, есть более эффективные способы сделать это, но я довольно часто использую pandas в своих исследованиях студентов и это то, что я бы сделал. Удачи тебе :) 1023 *

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...