У меня большой набор данных, который можно отсортировать только по его описанию. Описание описывает продукт, называя его следующим образом: ProductVariantSpesification. Я хочу разобраться в Варианте и создать новые наборы данных, включающие только тех, у кого есть тот же Вариант.
Я пытался:
400_variants = df[df[Description].str.contains("400")]
Как это будет выглядеть:
import pandas as pd
df = pd.read_excel(r'raw_data.xlsx', header = 0)
#Some code
df.to_excel(r'400.xlsx')
Я начинаю с чего-то вроде этого:
Index Description Quantity Date
1 Ketchup400J 5 5/10/2019
2 Ketchup600J 4 5/11/2019
3 Ketchup800U 6 5/12/2019
4 Ketchup400U 7 5/13/2019
5 Ketchup600J 8 5/14/2019
6 Ketchup400U 9 5/15/2019
7 Ketchup800i 5 5/16/2019
8 … … …
И хотите, чтобы выходные данные для варианта 400 были:
Index Description Quantity Date
1 Ketchup400J 5 5/10/2019
2 Ketchup400U 7 5/13/2019
3 Ketchup400U 9 5/15/2019