Мы получаем .tar.gz
файл от клиента каждый день, и я переписываю наш процесс импорта, используя SSIS. Один из первых шагов в моем процессе - распаковать файл .tar.gz
, который я получаю с помощью скрипта Python.
После распаковки у нас остается несколько CSV-файлов, которые я затем импортирую в SQL Server. Кроме того, я загружаю с помощью CozyRoc DataFlow Task Plus.
Большинство моих CSV-файлов загружаются без проблем, но у меня есть пять файлов, которые не работают. Читая журнал, я вижу, что процесс читает заголовок и первую строку, как будто нет разделителя заголовка (то есть он пытается импортировать заголовок столбца как ColumnHeader1ColumnValue1
Я взял один из этих CSV, скопировал 5 верхних строк в Excel, использовал Text-To-Columns для разграничения данных, а затем сохранил их как новый файл CSV.
Эта версия успешно импортирована .
Это заставляет меня думать, что каким-то образом оригинальный CSV не использует {CR}{LF}
в качестве разделителя строк, но я не знаю, как проверить. Есть предложения?