Именование листа Excel на основе данных в таблице с использованием pandas - PullRequest
1 голос
/ 09 июля 2020

Это мой текущий код:

import pandas as pd
from datetime import date, time, datetime
import numpy as np

####IMPORT FILES####

df=pd.read_csv("C:/Users/data.csv")
df1=pd.read_excel("C:/Users/user.xlsx")

####FILTERS####

data1 = df1[df1['SAG/non-SAG'] == "SAG"]
data = data1[data1['MEDIA TYPE'].isin(["TV/OTT", "TV", "TV "])]
c = np.array(data['ISCI or AD-ID #']) 


for i in c:
    c = np.append(c, i[0:-1])
    
print(c)
    
df_new = pd.DataFrame()
for i in c:
    df_new = pd.concat([df_new, df[df['Isci Code'] == i]])
    
df_new = pd.DataFrame()
for i in c:
    df_new = pd.concat([df_new, df[df['Isci Code'] == i]])
   

writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
        
for i,key in enumerate(c):    
    print(key)
    df_new.to_excel(writer, sheet_name=key)
writer.save()

И вот результат, который я получаю:

Вывод Excel:

введите описание изображения здесь

Мне нужно сгруппировать выделенные ISCI вместе и убедиться, что единственные ISCI на листе Excel совпадают с именем рабочего листа. Например: лист XXH должен содержать строки 2 и 10, лист CCH должен содержать строку 5, лист AAH должен содержать строки 3 и 6 и т. Д.

(В основном, коды XXH и XX означают одно и то же. Мы можем игнорировать последний di git 'H' при группировании ISCI.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...