Question

У меня много CSV-файлов, состоящих из разных имен столбцов, но схожих данных, например:

account  name    address
   1      2         3     
   4      5         6

lookup  accountname accountaddress
   7      8         9     
   10     11       12

, где account и lookup одинаковыполя, name и accountname одинаковы и так далее.Есть ли способ, которым я могу нормализовать или классифицировать все это в одно общее имя столбца?Я не могу отобразить это в хеш, потому что имена столбцов никогда не похожи, каждый раз, когда появляется новый файл, имя столбца отличается, и порядок, в котором они появляются в таблице, также различаются.

Jyoti Arora · Answer 1 · 26 сентября 2018

Вы можете попробовать что-то вроде этого:

проанализировать данные CSV с помощью dictreader row_list = [] with open(file_path) as f: cf = csv.DictReader(f, delimiter=<field separator>, fieldnames=[<columnslist>]) for row in cf: tmp_row = collections.OrderedDict() for column in cf.fieldnames: tmp_row[column] = row[column] row_list.append(tmp_row) return row_list

И затем вывести этот объект row_list в файл CSV с помощью dictwriter.

Python Predicting заголовки столбцов по данным столбцов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Python Predicting заголовки столбцов по данным столбцов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов