Я пытаюсь прочитать CSV-файл с помощью Pandas, но первый столбец содержит имя и фамилию, разделенные запятой. Это заставляет Панд думать, что есть 5 столбцов вместо 4, поэтому последний столбец теперь не имеет заголовка, что делает его невозможным для выбора.
Файл выглядит так:
CustomerName,ClientID,EmailDate,EmailAddress
FNAME1,LNAME1,100,2019-01-13 00:00:00.000,FNAME1@HOTMAIL.COM
FNAME2,LNAME2,100,2019-01-13 00:00:00.000,FNAME2@GMAIL.COM
FNAME3,LNAME3,100,2019-01-13 00:00:00.000,FNAME3@AOL.COM
FNAME4,LNAME4,100,2019-01-13 00:00:00.000,FNAME40@GMAIL.COM
FNAME5,LNAME5,100,2019-01-13 00:00:00.000,FNAME5@AOL.COM
Как мой код выглядит сейчас:
def convert_ftp_data():
file = os.getcwd() + "/data.csv"
data = pd.read_csv(file, index_col=False)
data["first_name"] = data["CustomerName"].str.split().str[0].str.title()
data["email"] = data["EmailAddress"]
clean_data = data.drop(data[["CustomerName", "ClientID", "EmailDate", "EmailAddress"]], 1)
print(clean_data)
Используя мой код, я получаю следующий вывод:
first_name email
0 FNAME1 2019-01-13 00:00:00.000
1 FNAME1 2019-01-13 00:00:00.000
2 FNAME1 2019-01-13 00:00:00.000
3 FNAME1 2019-01-13 00:00:00.000
4 FNAME1 2019-01-13 00:00:00.000
Мне нужно только выбрать поля FNAME и EmailAddress. Каков наилучший способ сделать это?