есть проблема, я уверен, что кто-то где-то сталкивался раньше. Мы отправляли клиентские файлы .csv по FTP на наши ноутбуки, а затем отправляли их по SQLL на наши базы данных Oracle, но сеть делала это медленным процессом. sqlload их - намного быстрее. Были некоторые проблемы с символами, поэтому я смог изменить NLS_LANG и теперь видеть те же символы в БД, что и при прохождении маршрута Windows. У 2 из этих 7 файлов есть проблемы. Из 500 000 записей несколько тысяч записываются в файл .bad, потому что строки разбиты. Любопытно, что в среде Windows этого не происходит. Не уверен, что это FTP или LFTP или транскрипция кодировки, которая происходит при входе в UNIX (MSWIN -> WE8ISO). Возможно, существует переменная set, которую можно использовать для того, чтобы LFTP в этом отношении вел себя как FTP. ... Есть идеи?
Моя альтернатива пластыря Если я не могу понять реальную проблему, описанную выше, это перезагрузить 2 .bad файлы после манипуляции с разделенной линией обратно в конец предыдущей строки. Вот пример разделенной записи в файле .bad. Кажется, что они всегда разделяются в этом поле адреса, часто там, где должна быть точка или запятая - см. Там, на «215 St», разрывы строки:
"","","1-1000035","","","1-1000035","SIS STRATEGIC INFORMATION SYSTEMS","SIS STRATEGIC INFORMATION SYSTEMS","","RESELLER","Active","N","Y","","","","","","$"
,"","","","","","","","80","","","","","","","","","","","","","(403) 281-4252","(780) 701-4050","North America","","","11432 215 St
Summerbarn Rd","","","Edmonton","AB","T2S3Y5","Canada","","","","","","1-1000035","","","","","","","","","","","","",
"","","","","",,,,"",,0,"UPSERT",10,"Y","Inserted By Widget",2009-10-23 15:08:03.387000000,2009-10-23 15:08:03.387000000,"",,"",,"","","1-1000035"^M