Python Predicting заголовки столбцов по данным столбцов - PullRequest
0 голосов
/ 26 сентября 2018

У меня много CSV-файлов, состоящих из разных имен столбцов, но схожих данных, например:


account  name    address
   1      2         3     
   4      5         6     

lookup  accountname accountaddress
   7      8         9     
   10     11       12     

, где account и lookup одинаковыполя, name и accountname одинаковы и так далее.Есть ли способ, которым я могу нормализовать или классифицировать все это в одно общее имя столбца?Я не могу отобразить это в хеш, потому что имена столбцов никогда не похожи, каждый раз, когда появляется новый файл, имя столбца отличается, и порядок, в котором они появляются в таблице, также различаются.

1 Ответ

0 голосов
/ 26 сентября 2018

Вы можете попробовать что-то вроде этого:

  1. проанализировать данные CSV с помощью dictreader row_list = [] with open(file_path) as f: cf = csv.DictReader(f, delimiter=<field separator>, fieldnames=[<columnslist>]) for row in cf: tmp_row = collections.OrderedDict() for column in cf.fieldnames: tmp_row[column] = row[column] row_list.append(tmp_row) return row_list

И затем вывести этот объект row_list в файл CSV с помощью dictwriter.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...