при изменении кадра данных некоторые столбцы дублируются - PullRequest
0 голосов
/ 21 апреля 2020

У меня есть набор данных:

,target,text
0,0,awww thats bummer shoulda got david carr third day
1,0,upset cant update facebook texting might cry result school today also blah
2,0,dived many times ball managed save 50 rest go bounds
3,0,whole body feels itchy like fire
4,0,behaving im mad cant see
5,0,whole crew
6,0,need hug

Я хотел отделить свой CSV и перенести все данные, у которых целевая цель = 0, в другой .csv

data_neg = df['target'] == '0'
df_neg = df[data_neg]
df_neg.to_csv("negative.csv")

И aftrer делает этот столбец в negative.csv, который не имеет названия, дублируется:

,Unnamed: 0,target,text
0,0,0,awww thats bummer shoulda got david carr third day
1,1,0,upset cant update facebook texting might cry result school today also blah
2,2,0,dived many times ball managed save 50 rest go bounds
3,3,0,whole body feels itchy like fire
4,4,0,behaving im mad cant see
5,5,0,whole crew

почему это происходит и как избежать дублирования? это происходит только с первым столбцом с id

1 Ответ

0 голосов
/ 21 апреля 2020

Создайте копию и укажите, какой столбец является вашим индексом при чтении файла CSV:

# ... 

df_neg = df[data_neg].copy()
df_neg.to_csv("negative.csv")


# For reading it
df_neg = pd.read_csv("negative.csv", index_col=0)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...