Я пытался решить простое сопоставление и преобразование с помощью Python и Pandas, но кажется, что я не двигаюсь в правильном направлении.
У меня есть простой CSV-файл, который мне нужно удалитьнекоторые столбцы, вставьте новые и вставьте некоторые данные в эти новые столбцы.
Я могу добавить это в словарь, но я не знаю, чтобы перебрать данные, чтобы получить каждый элемент массива встрока, а не весь список, связанный с ключом внутри словаря.
Мне удалось найти учебники с пандами, но никто из них не говорил об удалении / добавлении столбцов / новых данных.
IПолагаю, что читать код проще, чем пытаться его описать:
import numpy as np
import pandas as pd
# open file
data = pd.read_csv("sample_data.csv")
# delete columns
data = data.drop(['Current Status',
'Acquisition Channel',
'Attribution',
'Contact Record ID'],
axis='columns')
# rename Unit Price column to Total
data = data.rename(columns={'Unit Price': 'Total'})
# resort
data_blend = {'CODE': ['1'],
'Company': data['Company ID'],
'DEPARTMENT': np.nan,
'CLASS': np.nan,
'SALES': data['Total']>0,
'RETURNS': data['Total']<0,
'UNITS': data['Quantity'],
'DATE-TRAN': data['Transaction ID'],
'TRDATE-CCCCMMDD': data['Date'],
'SKU-NEW': data['Product ID'],
'TRX-SOURCE': ['8'],
'ASSISTED-SALE': ['A'],
'RET-ORIG-DATE': data['Transaction ID'],
'RET-ORIG-TERM': data['Date'],
'TIME-HHMM00': ['AAAAAA'],
}
modified_data = pd.DataFrame.from_dict(data_blend)
Я ценю любую помощь по этому вопросу.