Мне нужно классифицировать продукты в наборе данных по возрасту на момент их продажи на уровне месяца. Я основываю классификации на числовых значениях индекса, представляющих месяцы в наборе данных.
Однако мне также нужно учитывать строковые значения в столбцах, таких как «Тип продукта» и «Тип бизнеса», в этой категории. Как мне наиболее эффективно это сделать?
Вот как выглядит мой код, если учитывать только числовые значения:
ProductAgeFunctions = [df['LaunchMonthIndex'] == 0,
(df['MonthIndex'] - df['LaunchMonthIndex'] <= 23),
(df['MonthIndex'] - df['LaunchMonthIndex'] >= 24) & (df['MonthYearIndex']
- df['LaunchMonthIndex'] <= 47),
(df['MonthYearIndex'] - df['LaunchMonthIndex'] >= 48)]
ProductAgeChoices = ['N/A', 'Up to 2 Years', '2 to 4 Years', 'More Than 4 Years']
df['ProductAgeCategories'] = np.select(ProductAgeFunctions, ProductAgeChoices, default='Other')