Какой анализ я могу запустить для этого большого набора файлов Excel? - PullRequest
0 голосов
/ 01 марта 2020

Я работаю в компании, которая продает ведра клиентам. Я делаю это для классного проекта, и я не лучший, когда дело доходит до Python. В файле перечислены тысячи клиентов, которые приобрели различные виды ведер с 2015-2019 гг. Мой финансовый отдел хотел бы узнать, кто возвращал их, а кто нет, и по какой ставке?

Мне удалось использовать python, чтобы использовать только выбранные столбцы ( см. эти данные ), которые имели отношение к моему анализу. Какой анализ я должен выполнить в Python после экспорта в файл csv, чтобы ответить на мой вопрос? Я уже сделал сводную таблицу и диаграмму (чтобы подсчитать, сколько клиентов возвращает ведра и в каком году), но хочу использовать Python, чтобы упростить чтение и анализ, чтобы я мог ответить на вопрос.

import pandas as pd

data = pd.read_excel (r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTracker.xlsx',
sheet_name='2015-2019') 
df = pd.DataFrame(data, columns= ['Customer for Tracking::CustomerName',
          'Customer for Tracking::CustomerID',
          'Order for Tracking::OrderDate',
          'Products for Tracking::ProdName',
          'Transaction Items for Tracking::Description',
          'RemovalNote',
          'RemovalDate',
          'OrderID'])


df.to_csv(r'C:\Users\Vilma\Documents\CIS450\Inidividual project\ContainerTrackerTrimmed.csv',index = False)
print (df)

1 Ответ

0 голосов
/ 01 марта 2020

Пожалуйста, прочитайте мой комментарий о публикации воспроизводимого вопроса с примерами, которые мы можем скопировать, вставить и поработать, чтобы найти решение.

При этом, и если я вас правильно понимаю, я считаю, что .groupby() функция может помочь вам:

# fill your black entries with something like No Return

df = df[df['RemovalNote'] == ''] = 'No Return' # fill empty rows

df1 = df.groupby('Customer for Tracking::CustomerName')['RemovalNote'].value_counts()

print(df1)

Надеюсь, это поможет, даже если ваш вопрос был очень неоднозначным.

...