конвертировать CSV-файл в DBF - PullRequest
4 голосов
/ 23 января 2012

Я получил много CSV-файлов и хотел бы преобразовать их в DBF-файл. Я нашел код от Итана Фурмана (см. Ниже) Это работает действительно хорошо - большое спасибо - но мои CSV-файлы имеют в качестве разделителя точку с запятой. Итак, с помощью кода Python помещает все мои данные в один столбец, но у меня есть 5 столбцов. Как я могу изменить разделитель?

вот ссылка: Конвертировать .csv файл в .dbf, используя Python?

особенно:

Используя пакет dbf, вы можете получить базовый CSV-файл с кодом, подобным следующему:

import dbf
some_table = dbf.from_csv(csvfile='/path/to/file.csv', to_disk=True)

Это создаст таблицу с тем же именем, а также поля символов или памятки и имена полей f0, f1, f2 и т. Д.

Для другого имени файла используйте параметр filename, и если вы знаете имена полей, вы также можете использовать параметр field_names.

some_table = dbf.from_csv(csvfile='data.csv', filename='mytable',
        field_names='name age birth'.split())

Достаточно базовая документация доступна здесь .

1 Ответ

3 голосов
/ 23 января 2012

Глядя на код dbf, я не вижу способа передать диалект, поэтому вы можете преобразовать свои файлы следующим образом:

import csv
reader = csv.reader(open('input.csv'), delimiter=';')
writer = csv.writer(open('output.csv', 'w'))
for row in reader:
    writer.writerow(row)

Примечание. Это приведет к правильному цитированию строк, которые ужесодержать запятую как часть его содержимого.

Редактировать: Если вы хотите исправить dbf.from_csv, чтобы принять delimiter в качестве параметра, чтобы избежать преобразования всех ваших CSV-файлов, это должно работать:

--- dbf.py.orig 2012-01-23 12:48:32.112101218 +0100
+++ dbf.py  2012-01-23 12:49:59.468534408 +0100
@@ -4502,13 +4502,14 @@
         print str(table[0])
     finally:
         table.close()
-def from_csv(csvfile, to_disk=False, filename=None, field_names=None, extra_fields=None, dbf_type='db3', memo_size=64, min_field_size=1):
+def from_csv(csvfile, to_disk=False, filename=None, field_names=None, extra_fields=None, dbf_type='db3', memo_size=64, min_field_size=1,
+             delimiter=','):
     """creates a Character table from a csv file
     to_disk will create a table with the same name
     filename will be used if provided
     field_names default to f0, f1, f2, etc, unless specified (list)
     extra_fields can be used to add additional fields -- should be normal field specifiers (list)"""
-    reader = csv.reader(open(csvfile))
+    reader = csv.reader(open(csvfile), delimiter=delimiter)
     if field_names:
         field_names = ['%s M' % fn for fn in field_names]
     else:
...