У меня есть пара csv, где есть две колонки: Item и Price. Некоторые csv имеют разное количество строк, некоторые точно совпадают. Как я могу затем объединить CSV так, чтобы цены соответствовали правильному имени индекса (Item), где цены для каждого CSV идут в свой собственный столбец (как дата CSV) И если Item не присутствует в индексе, он будет соединен? Я вручную добавил дату создания файла в качестве еще одного столбца для каждого CSV, так как не смог учесть это при создании первого пакета, но я не уверен, что это действительно полезно, поскольку я могу просто установить имя метки в качестве даты.
Я думаю что-то вроде этого:
Item csv/date1 csv/date2 csv/date...
Topper Blue Glitter1 ea 2.50 2.75 2.55
Topper Pink Glitter1 ea 2.50 2.75 2.55
Bamboo Needles 35MM1 ea 2.75 2.75 2.99
6MM Knitting Needles ea 3.50
8MM Bamboo Needles ea 3.79
РЕДАКТИРОВАТЬ
Вывод с concat:
0 Date Price
Item
DoleSunflower Bacon Crunch Cho.. NaN 2020-03-16 $4.98
Apple Slices280 g NaN 2020-03-16 $4.00
PC OrganicsCooking Onions907 g NaN 2020-03-16 $2.98
Limes1 ea NaN 2020-03-16 $0.68
Granny Smith Apples NaN 2020-03-16 $1.09
... ... ... ...
Greenhouse Peppers, Yellow 2020-03-17 NaN NaN
Lettuce Iceberg1 ea 2020-03-17 NaN NaN
Farmer's MarketSweet Baby 2020-03-17 NaN NaN
Kohlrabi 2020-03-17 NaN NaN
Farmer's MarketFM English Cucu 2020-03-17 NaN NaN
Вывод с слиянием:
Price_x Date_x Price_y Date_y
Item
DoleSunflower Bacon C $4.98 2020-03-16 NaN NaN
Apple Slices280 g $4.00 2020-03-16 NaN NaN
PC OrganicsCooking On $2.98 2020-03-16 NaN NaN
Limes1 ea $0.68 2020-03-16 $0.68 2020-03-17
Limes1 ea $0.68 2020-03-16 $0.68 2020-03-17
Наконец-то получили желаемые результаты с помощью concat. Предложение ниже сделало итерацию проще:
03-16-2020 03-17-2020 03-20-2020
Item
DoleSunflower Bacon Crunch $4.98 NaN NaN
Apple Slices280 g $4.00 NaN NaN
PC OrganicsCooking Onio $2.98 NaN NaN
Limes1 ea $0.68 NaN NaN
Granny Smith Apple $1.09 NaN NaN
... ... ... ...
Green Cabbage NaN NaN $2.52
Celery Stalks1 ea NaN NaN $1.9