Импорт UTF-8, плоских файлов другого формата (текст, разделитель табуляции) в SQL Server - PullRequest
0 голосов
/ 06 июня 2018

Я использую SQL Server 2014 Enterprise edition.Я пытаюсь импортировать UTF-8 и другие отформатированные текстовые файлы.У меня есть много файлов, которые были экспортированы из инструментов судебной экспертизы и предоставлены нам в форматах UTF-8, TCA Taiwan и Chinese (Big5).Когда я сопоставляю файлы, SQL Server считает их ANSI (то есть, когда я делаю «предложить типы» на вкладке «Дополнительно», SQL Server предлагает varchar типы данных, даже если кодовая страница на первой вкладке - 65001 (UTF-8)).

Означает ли это, что файл будет импортирован как UTF-8, но в столбец varchar?Или я потеряю своих иностранных персонажей?Или данные на самом деле ANSI, хотя кодировка показывает UTF-8 в мастере импорта?Смесь обоих?Если я изменю типы данных на nvarchar, я получу проблемы с кодированием 65001 против 1252 и т. Д., Поскольку SQL Server не может обработать все это.

Спасибо за помощь.

...