У меня есть следующий набор данных:
df=pd.read_csv('/path/text.csv')
со столбцами A B C D
(показано с помощью print(df.columns)
)
Я пытался создать новые столбцы с помощью столбцы из этого файла следующим образом:
for index, row in df.iterrows():
parsed=urlparse(row['B'])
netloc.append(parsed.netloc) # E
paths.append(parsed.path) # F
Я хотел бы управлять этим набором данных, включая созданные новые столбцы (E
и F
), а также старые и сохраненные набор данных как data frame
и csv
(так как он очень большой, может быть полезно сохранить копию в памяти). Мой ожидаемый вывод будет набор данных с 6
столбцы (A B C D E F)
, 4
из старого набора данных и 2
из нового.
Как я могу включить столбцы A B C D
в новый набор данных и сохранить его в обоих форматах?
Я пытался с
dataset = pd.DataFrame({"A": a, "B" : b, "C" : c, "D" : d, "E": e, "F": f})
dataset.to_csv('path/text_1.csv', mode='w', header=True, index=False)
, но я получил ошибку, что B не определен (NameError: name 'B' is not defined
).
Любая помощь будет принята с благодарностью.
Спасибо