Я использую spyder IDE для этой цели.Цель состоит в том, чтобы создать сегменты с фиксированным средним значением 30-50 $ по отраслевым сегментам и только 2 ведущими покупателями на сегмент, при этом следует создать новый сегмент в том же сегменте отрасли с расширенной серией 1,2.Разделение должно быть автоматизировано таким образом - (Пример [Алюминий-1, Алюминий-2] и т. Д. Если средние продажи составляют 5 $ для 5 клиентов, то следующий клиент должен попасть в новый сегмент с тем же именем отраслевого сегмента сизменение в расширении series.ie Алюминий-1, Алюминий-2 и т. д.)
import os
os.getcwd()
os.chdir("E:/TNVB1/regression/files")
import numpy
import matplotlib.pyplot as plot
import pandas
data= pandas.DataFrame.from_csv('abc_segment.csv')
print(data)
str(data)
data['Industry_Segment'].value_counts()
n = data.groupby(['Industry_Segment'])['Sales','Top_Cust_count'].agg('sum')
dn =pandas.DataFrame(n)
print(dn)
Я сгруппирован по сегментам промышленности с продажами и без клиентов.Выходное значение равно
Sales Top_cust_count
Industry_Segment Customer_Name
ALUMINIUM Customer1 56 0
Customer2 8 0
Customer3 21 0
Customer4 280 1
Customer5 20 0
Customer6 297 1
Customer7 14 0
Теперь требуемый выходной сигнал равен
Sales Top_Cust_count
Aluminium-1 Customer1 12 1
Aluminium-1 Customer2 6 0
Aluminium-1 Customer3 13 0
Aluminium-1 Customer4 8 1
Aluminium-1 Customer5 11 0
Aluminum-2 Customer6 16 1
Aluminium-2 Customer7 34 1
. Выше приведен пример желаемого разделения
, которое необходимо автоматически разделить до фиксированных условий ипродолжайте до тех пор, пока дальнейшее разделение невозможно. Условия для каждого сегмента должны быть max_top_cust_count, равного 2. и Среднее значение продаж в долларах США должно быть 30-50.