Как преобразовать файл с разделителями табуляции в формат CSV? - PullRequest
18 голосов
/ 08 апреля 2011

У меня есть текстовый файл в этом формате:

{

attribute1 attribute2 attribute3.... attributeN

value"A" value"B" value"C".... value"Z"

/* next line of values*/

}

Каждое слово отделяется вкладкой.

Как мне конвертировать в формат CSV?Я пытался использовать Excel, но это дает проблемы совместимости.

Ответы [ 3 ]

25 голосов
/ 08 апреля 2011

Импортируйте данные с помощью Excel (Данные> Загрузить из текстового файла), используя вкладку в качестве разделителя столбцов. Затем сохраните файл как csv.

У него не может быть проблем с совместимостью, это базовая задача, и я делал это довольно часто в прошлом.

12 голосов
/ 08 апреля 2011

Если вы можете использовать язык сценариев , вы можете дать Python выстрел:

import csv

# read tab-delimited file
with open('yourfile.tsv','rb') as fin:
    cr = csv.reader(fin, delimiter='\t')
    filecontents = [line for line in cr]

# write comma-delimited file (comma is the default delimiter)
with open('yourfile.csv','wb') as fou:
    cw = csv.writer(fou, quotechar='', quoting=csv.QUOTE_NONE)
    cw.writerows(filecontents)

Пример сеанса интерпретатора:

>>> import csv
>>> with open('yourfile.tsv','rb') as fin:
...     cr = csv.reader(fin, delimiter='\t')
...     filecontents = [line for line in cr]
...
>>> with open('yourfile.csv','wb') as fou:
...     cw = csv.writer(fou, quotechar='', quoting=csv.QUOTE_NONE)
...     cw.writerows(filecontents)
...
>>> with open('yourfile.csv','rb') as see_how_it_turned_out:
...     for line in see_how_it_turned_out: 
...         line
... 
'attribute1,attribute2,attribute3,attributeN\r\n'
'value"A",value"B",value"C",value"Z"\r\n'

Примечания:

  • Разделитель поля по умолчанию равен ,.

  • Терминатор строки по умолчанию для csv.writer равен \r\n, но в случае необходимости вы можете указать альтернативу в качестве аргумента ключевого слова AKA kwarg .

Альтернативный пример окончания строки:

with open('yourfile.csv','wb') as fou:
    cw = csv.writer(fou,quotechar='',quoting=csv.QUOTE_NONE,lineterminator='\n')
    ...
0 голосов
/ 08 апреля 2011

Вот код Excel-VBA, который будет выполнять это преобразование. Вставьте его в визуальный базовый редактор Excel (Alt-F11) и запустите его (конечно, после корректировки имен файлов).

Sub TabToCsv()

    Const ForReading = 1, ForWriting = 2
    Dim fso, MyTabFile, MyCsvFile, FileName
    Dim strFileContent as String
    Set fso = CreateObject("Scripting.FileSystemObject")

    ' Open the file for input.
    Set MyTabFile = fso.OpenTextFile("c:\testfile.dat", ForReading)

    ' Read the entire file and close.
    strFileContent = MyTabFile.ReadAll
    MyTabFile.Close

    ' Replace tabs with commas.
    strFileContent = Replace(expression:=strFileContent, _
                             Find:=vbTab, Replace:=",") 
    ' Can use Chr(9) instead of vbTab.

    ' Open a new file for output, write everything, and close.
    Set MyCsvFile = fso.OpenTextFile("c:\testfile.csv", ForWriting, True)
    MyCsvFile.Write strFileContent
    MyCsvFile.Close

End Sub
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...