По умолчанию pandas.read_csv()
изменяет дубликаты заголовков CSV в форме X, X.1, ..., X.N.
Флаг mangle_dupe_cols = False
возвращает:
ValueError: Setting mangle_dupe_cols=False is not supported yet
Мне кажется глупым, почему вы позволяете использовать логический флаг, но отключаете логическое значение ...
Есть ли способ через API pandas, который лучше всего подходит для обнаружения / удаления дублирующихся заголовков при инициализации DataFrame методом read_csv()
?
Возможное решение (без API) :
headers = set(df.columns) # will include 'X' and 'X.1'
n = 0
unique = []
for i in range(len(headers)):
d = 1
if i != n:
continue # skip dupes
elif (headers[i] + '.' + str(d)) in headers:
while True: # find next unique element
d += 1
n += 1
if (headers[i] + '.' + str(d)) not in headers:
break
unique.append(headers[i])
n += 1