Добавить столбцы из старого набора данных в новый - PullRequest
0 голосов
/ 04 апреля 2020

У меня есть следующий набор данных:

df=pd.read_csv('/path/text.csv')

со столбцами A B C D (показано с помощью print(df.columns))

Я пытался создать новые столбцы с помощью столбцы из этого файла следующим образом:

for index, row in df.iterrows():
    parsed=urlparse(row['B'])
    netloc.append(parsed.netloc) # E
    paths.append(parsed.path) # F

Я хотел бы управлять этим набором данных, включая созданные новые столбцы (E и F), а также старые и сохраненные набор данных как data frame и csv (так как он очень большой, может быть полезно сохранить копию в памяти). Мой ожидаемый вывод будет набор данных с 6 столбцы (A B C D E F), 4 из старого набора данных и 2 из нового.

Как я могу включить столбцы A B C D в новый набор данных и сохранить его в обоих форматах?

Я пытался с

dataset = pd.DataFrame({"A": a, "B" : b, "C" : c, "D" : d, "E": e, "F": f})
dataset.to_csv('path/text_1.csv', mode='w', header=True, index=False)

, но я получил ошибку, что B не определен (NameError: name 'B' is not defined).

Любая помощь будет принята с благодарностью.

Спасибо

1 Ответ

1 голос
/ 04 апреля 2020

Я думаю, что функция слияния будет полезна для вас.

Если у вас есть два фрейма данных, вы можете «соединить» их вертикально или горизонтально. Слияние может помочь вам присоединиться горизонтально. Функцию следует использовать следующим образом:

df1.merge(df2, left_on='lkey', right_on='rkey')

То, что вы должны учитывать, это имена полей обоих фреймов данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...