Используйте BCP для импорта CSV-файла в SQL 2005 или 2008 - PullRequest
6 голосов
/ 29 мая 2009

У меня есть файл CSV, и мне нужно импортировать его в таблицу в SQL 2005 или 2008. Имена столбцов и количество в CSV отличаются от имен столбцов таблицы и количества. CSV разделяется на «;» .

Пример

CSV FILEcontents:

FirstName;LastName;Country;Age
Roger;Mouthout;Belgium;55

Таблица персоны SQL

Columns: FName,LName,Country

Ответы [ 4 ]

9 голосов
/ 29 мая 2009

Я бы создал временную таблицу, массово вставил лот, выбрал в новую таблицу то, что вам нужно, и удалил временную таблицу.

Что-то вроде

CREATE TABLE dbo.TempImport
(
    FirstName varchar(255),
    LastName varchar(255),
    Country varchar(255),
    Age varchar(255)
)
GO
BULK INSERT dbo.TempImport FROM 'PathToMyTextFile' WITH (FIELDTERMINATOR = ';', ROWTERMINATOR = '\n')
GO
INSERT INTO dbo.ExistingTable
(
    FName,
    LName,
    Country
)
SELECT  FirstName,
       LastName,
       Country
FROM       dbo.TempImport
GO
DROP TABLE dbo.TempImport
GO
9 голосов
/ 29 мая 2009

Вы можете использовать формат файла при импорте с помощью bcp:

Создайте файл формата для вашей таблицы:

 bcp [table_name] format nul -f [format_file_name.fmt] -c -T 



 9.0
4
1       SQLCHAR       0       100     ","      1     FName             SQL_Latin1_General_CP1_CI_AS
2       SQLCHAR       0       100     ","      2     LName             SQL_Latin1_General_CP1_CI_AS
3       SQLCHAR       0       100     ","      3     Country           SQL_Latin1_General_CP1_CI_AS
4       SQLCHAR       0       100     "\r\n"   0     Age               SQL_Latin1_General_CP1_CI_AS

Редактировать файл импорта. Хитрость заключается в том, чтобы добавить фиктивную строку для поля, которое вы хотите пропустить, и добавить '0' как порядок столбцов сервера.

Затем импортируйте данные, используя этот файл формата, указав ваш входной файл, этот файл формата и разделитель:

bcp [table_name] in [data_file_name] -t , -f [format_file_name.fmt] -T
3 голосов
/ 29 мая 2009

Теперь я предпочитаю использовать файлы формата XML, например, с BULK INSERT или OPENROWSET:

<?xml version="1.0"?>
<BCPFORMAT xmlns="http://schemas.microsoft.com/sqlserver/2004/bulkload/format" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
 <RECORD>
  <FIELD ID="1" xsi:type="CharTerm" TERMINATOR="|" COLLATION="SQL_Latin1_General_CP1_CI_AS"/>
  <FIELD ID="2" xsi:type="CharTerm" TERMINATOR="|" MAX_LENGTH="37"/>
  <FIELD ID="3" xsi:type="CharTerm" TERMINATOR="|" MAX_LENGTH="41"/>
  <FIELD ID="4" xsi:type="CharTerm" TERMINATOR="|" MAX_LENGTH="17"/>
  <FIELD ID="5" xsi:type="CharTerm" TERMINATOR="\r\n" MAX_LENGTH="10" COLLATION="SQL_Latin1_General_CP1_CI_AS"/>
 </RECORD>
 <ROW>
  <COLUMN SOURCE="1" NAME="i" xsi:type="SQLCHAR"/>
  <COLUMN SOURCE="2" NAME="j" xsi:type="SQLUNIQUEID"/>
  <COLUMN SOURCE="3" NAME="k" xsi:type="SQLNUMERIC" PRECISION="18" SCALE="0"/>
  <COLUMN SOURCE="4" NAME="l" xsi:type="SQLBINARY"/>
  <COLUMN SOURCE="5" NAME="m" xsi:type="SQLVARYCHAR"/>
 </ROW>
</BCPFORMAT>

Затем вы можете использовать команду BULK INSERT на стороне сервера следующим образом:

BULK INSERT foo FROM '\\mydomain.com\bar\bletch' WITH (FORMATFILE='foo.xml', ERRORFILE='foo.errors',  FIRSTROW = 1, BATCHSIZE=10000)

в качестве альтернативы, если вы хотите изменить данные «в полете», вы можете использовать

INSERT foo(i, j,k)
SELECT foo_delimited.i, foo_delimited.j, foo_delimited.k * 2
 OPENROWSET(BULK 'foo',
                   FORMATFILE= 'foo.xml')
        AS foo_delimited
0 голосов
/ 13 июня 2018

Для информации, с той же структурой, вы можете использовать такой тип заявления:

bcp schema.Table in "/Samples/AdventureWorksDW/DimCurrency.csv" \
    -S db.url \
    -d databaseName \ 
    -U userName \
    -P pwd  \
    -t ; `# The field separator ` \
    -c  `# Insert as character and doesn't ask the data type`  \ 
    -q `# With quote -- seems to be mandatory` 

См. пример

...